Ana Sayfa Teknoloji Dünyanın en güçlü yeni açık kaynaklı yapay zeka modeliyle tanışın: HyperWrite’ın Reflection...

Dünyanın en güçlü yeni açık kaynaklı yapay zeka modeliyle tanışın: HyperWrite’ın Reflection 70B’si

55
0

Sektör lideri AI kapsamına ilişkin en son güncellemeler ve özel içerikler için günlük ve haftalık bültenlerimize katılın. Daha Fazla Bilgi Edinin


Şehirde yeni bir kral var: Yapay zeka yazma girişiminin kurucu ortağı ve CEO’su Matt Shumer HiperYazmabugün Meta’nın açık kaynaklı Llama 3.1-70B Instruct’ına dayanan, yeni bir hata öz düzeltme tekniğinden yararlanan ve üçüncü taraf kıyaslamalarında üstün performans gösteren yeni bir büyük dil modeli (LLM) olan Reflection 70B’yi tanıttı.

Shumer’in duyurduğu gibi X sosyal ağında bir gönderiReflection-70B artık “dünyanın en iyi açık kaynaklı yapay zeka modeli” olarak görünüyor.

Aşağıdaki grafiği referans performansını göstererek burada paylaştı:

Reflection 70B, sonuçların kontaminasyondan arınmış olduğundan emin olmak için LMSys’nin LLM Decontaminator’ını kullanarak MMLU ve HumanEval dahil olmak üzere çeşitli kıyaslamalarda titizlikle check edildi. Bu kıyaslamalar, Reflection’ın Meta’nın Llama serisindeki modellerden sürekli olarak daha iyi performans gösterdiğini ve en iyi ticari modellerle başa baş rekabet ettiğini gösteriyor.

Yapabilirsiniz bunu burada bir demo olarak kendiniz deneyin bir “oyun alanı” internet sitesinde, ancak Shumer X’te not aldıAçık kaynaklı yapay zeka modellerinin yeni kralının duyurulması, demo sitesini trafikle doldurdu ve ekibi talebi karşılamak için yeterli sayıda GPU (grafik işlem birimi, Nvidia ve diğer üreticilerin çoğu üretken yapay zeka modelini eğitmek ve çalıştırmak için kullanılan değerli yongaları) bulmak için çabalıyor.

Reflection 70B’nin farkı nedir?

Shumer, Reflection 70B’nin yalnızca üst düzey modellerle rekabet edebildiğini değil, aynı zamanda hata tespiti ve düzeltme gibi benzersiz yetenekler de getirdiğini vurguladı.

Shumer’ın DM üzerinden VentureBeat’e söylediği gibi: “Bu fikir hakkında aylardır düşünüyorum. LLM’ler halüsinasyon görür, ancak rotalarını düzeltemezler. Bir LLM’ye kendi hatalarını nasıl tanıyıp düzelteceğini öğretirseniz ne olur?”

Bu nedenle adı “Yansıma”dır; bu mannequin, üretilen metin üzerinde düşünüp, çıktı olarak kullanıcıya sunmadan önce doğruluğunu değerlendirebilir.

Modelin avantajı, kendi muhakemesindeki hataları tespit edip, cevabı tamamlamadan önce bunları düzeltmesine olanak tanıyan yansıma ayarlaması adı verilen bir teknikte yatıyor.

Reflection 70B, muhakeme ve hata düzeltme için birkaç yeni özel belirteç sunarak kullanıcıların modelle daha yapılandırılmış bir şekilde etkileşim kurmasını kolaylaştırır. Çıkarım sırasında, mannequin muhakemesini özel etiketler içinde çıktı olarak verir ve bir hata tespit ederse gerçek zamanlı düzeltmelere olanak tanır.

Oyun alanı demo sitesi, kullanıcının kullanması için önerilen istemleri içerir ve Reflection 70B’ye “Strawberry” kelimesinde kaç tane “r” harfi örneği olduğunu ve hangi sayının daha büyük olduğunu, 9.11 mi yoksa 9.9 mu olduğunu sorar; önde gelen tescilli olanlar da dahil olmak üzere birçok AI modelinin tutarlı bir şekilde doğru yanıtlamayı başaramadığı iki basit sorun. Testlerimiz yavaştı, ancak Reflection 70B sonunda 60+ saniye sonra doğru yanıtı sağladı.

Bu, modeli özellikle yüksek doğruluk gerektiren görevler için kullanışlı hale getirir, çünkü kesinliği artırmak için muhakemeyi ayrı adımlara ayırır. Mannequin, AI kod deposu aracılığıyla indirilebilir Sarılma Yüzüve API erişiminin bugün ilerleyen saatlerde GPU servis sağlayıcısı aracılığıyla kullanıma sunulması planlanıyor Hiperbolik Laboratuvarlar.

Daha da güçlü, daha büyük bir mannequin yolda

Reflection 70B’nin piyasaya sürülmesi Reflection serisinin sadece başlangıcı. Shumer, daha da büyük bir mannequin olan Reflection 405B’nin önümüzdeki hafta piyasaya sürüleceğini duyurdu.

VentureBeat’e verdiği demeçte, HyperWrite’ın Reflection 70B modelini birincil yapay zeka yazma asistanı ürününe entegre etmek için çalıştığını söyledi.

“Modeli HyperWrite’a entegre etmenin çeşitli yollarını araştırıyoruz. Yakında bu konuda daha fazla bilgi paylaşacağım” diye söz verdi.

Reflection 405B’nin bugün piyasadaki en iyi kapalı kaynaklı modellerden bile daha iyi performans göstermesi bekleniyor. Shumer ayrıca HyperWrite’ın eğitim sürecini ve kıyaslamaları ayrıntılı olarak açıklayan ve Reflection modellerini destekleyen yeniliklere ilişkin içgörüler sağlayan bir rapor yayınlayacağını söyledi.

Reflection 70B’nin temel modeli Meta’nın Llama 3.1 70B Instruct’ı üzerine kuruludur ve mevcut araçlar ve iletişim hatlarıyla uyumluluğu garanti altına alan stok Llama sohbet formatını kullanır.

Shumer, hızlı AI modeli eğitimini mümkün kıldığı için Glaive’e teşekkür ediyor

Reflection 70B’nin başarısına önemli katkıda bulunan etkenlerden biri, kullanım senaryolarına özgü veri kümeleri oluşturma konusunda uzmanlaşmış bir girişim olan Glaive tarafından üretilen sentetik verilerdir.

Glaive’in platformu, küçük ve oldukça odaklanmış dil modellerinin hızlı bir şekilde eğitilmesini sağlayarak, AI araçlarına erişimin demokratikleştirilmesine yardımcı olur. Hollandalı mühendis Sahil Chaudhary tarafından kurulan Kılıç Yapay zeka geliştirmedeki en büyük darboğazlardan biri olan yüksek kaliteli, göreve özgü verilerin kullanılabilirliğini çözmeye odaklanıyor.

Glaive’in yaklaşımı, şirketlerin modelleri hızlı ve uygun maliyetli bir şekilde ince ayar yapmasına olanak tanıyan, belirli ihtiyaçlara göre uyarlanmış sentetik veri kümeleri oluşturmaktır. Şirket, HumanEval gibi görevlerde birçok büyük açık kaynaklı alternatifi geride bırakan 3B parametre modeli gibi daha küçük modellerle zaten başarı göstermiştir. Spark Capital, Glaive için 3,5 milyon dolarlık bir tohum yatırım turuna öncülük etti Sahil’in, uzman modellerin herhangi bir görev için kolayca eğitilebileceği bir emtia haline gelmiş yapay zeka ekosistemi yaratma vizyonunu bir yıldan fazla bir süre önce destekledi.

Glaive’in teknolojisinden yararlanan Reflection ekibi, Reflection 70B’yi eğitmek için yüksek kaliteli sentetik verileri hızla üretebildi. Shumer, haftalar yerine saatler içinde veri üretilmesini sağlayarak geliştirme sürecini hızlandırdığı için Sahil ve Glaive AI platformuna teşekkür ediyor.

Shumer’ın VentureBeat’e doğrudan gönderdiği mesajda belirttiğine göre, eğitim süreci toplamda üç hafta sürdü. “Üç hafta boyunca modelin beş yinelemesini eğittik,” diye yazdı. “Veri seti tamamen özel, Glaive’in sentetik veri üretim sistemleri kullanılarak oluşturuldu.”

HyperWrite, Lengthy Island’da nadir bulunan bir AI girişimidir

İlk bakışta, Reflection 70B’nin hiçbir yerden gelmediği düşünülüyor. Ancak Shumer yıllardır AI oyununda.

Başlangıçta Otherside AI adını verdiği şirketini 2020 yılında kurdu Jason Kuperberg’in yanındaBaşlangıçta New York’un doğusunda, Lengthy Island’da, arabayla yaklaşık bir saat uzaklıktaki Melville adlı bir köyde bulunuyordu.

Tüketicilerin madde işaretlerine dayalı e-postalar ve yanıtlar oluşturması için bir Chrome uzantısı olarak başlayan ancak makale taslağı hazırlama, metni özetleme ve hatta e-postaları düzenleme gibi görevleri ele alacak şekilde gelişen imza ürünü HyperWrite etrafında ivme kazandı. HyperWrite, Kasım 2023 itibarıyla iki milyon kullanıcıya ulaştı ve kurucu ikiliye bir yer kazandırdı Forbes‘ yıllık “30 Yaş Altı 30” ListesiSonunda Shumer ve Kuperberg ve büyüyen ekibi şirketin ismini değiştirmeye karar verdi.

HyperWrite’ın son turu, Mart 2023’te açıklandıMadrona Enterprise Group dahil yatırımcılardan 2,8 milyon dolarlık bir enjeksiyon gördü. Bu fonlamayla HyperWrite, internet tarayıcılarını uçuş rezervasyonundan LinkedIn’de iş adayları bulmaya kadar çeşitli görevleri halledebilen sanal uşaklara dönüştürmek gibi yeni AI odaklı özellikler tanıttı.

Shumer, özellikle karmaşık otomasyon görevlerini araştırırken doğruluk ve güvenliğin HyperWrite için en önemli öncelikler olmaya devam ettiğini belirtiyor. Platform, kullanıcı geri bildirimlerine göre izleme ve iyileştirmeler yaparak kişisel asistan aracını hala geliştiriyor. Reflection 70B’de gömülü yapılandırılmış akıl yürütme ve yansıtmaya benzer bu dikkatli yaklaşım, Shumer’ın yapay zeka geliştirmede hassasiyet ve sorumluluğa olan bağlılığını gösteriyor.

HyperWrite ve Reflection AI mannequin ailesinin bundan sonraki adımları neler?

Shumer, geleceğe baktığında Reflection serisi için daha da büyük planlara sahip. Reflection 405B’nin yakında piyasaya sürülmesiyle, şu anda küresel lider olan OpenAI’nin GPT-4o gibi tescilli veya kapalı kaynaklı LLM’lerin performansını bile önemli bir farkla geçeceğine inanıyor.

Bu, yalnızca OpenAI için kötü bir haber değil; OpenAI’nin, özel yatırımlardan önemli bir yeni tur toplamayı hedeflediği bildiriliyor. Nvidia ve Apple gibi — ancak Anthropic ve hatta Microsoft gibi diğer kapalı kaynaklı mannequin sağlayıcıları da var.

Hızla gelişen yapay zeka dünyasında güç dengesinin bir kez daha değiştiği görülüyor.

Şimdilik, Reflection 70B’nin piyasaya sürülmesi açık kaynaklı AI için önemli bir dönüm noktasını işaret ediyor ve geliştiricilere ve araştırmacılara tescilli modellerin yetenekleriyle rekabet eden güçlü bir araca erişim sağlıyor. AI gelişmeye devam ederken, Reflection’ın akıl yürütme ve hata düzeltme konusundaki benzersiz yaklaşımı açık kaynaklı modellerin başarabilecekleri için yeni bir standart belirleyebilir.


Kaynak