Nane&Limon’dan Şubat — Mart 2024 Yapay Zeka ve NLP Bülteni: 1-bit LLM’lerin Çağı

Published in

Nane & Limon

5 min readMar 4, 2024

Misral AI — OpenAI — Elon Musk — GPT — EVO—StarCoder 2 — The Stack v2

Merhaba Yapay Zeka ve Doğal Dil İşleme (NLP) meraklıları! Nane&Limon olarak sizler için seçtiğimiz makaleler, rehberler ve haberlerle karşınızdayız. Bu ayki bültenimizde yapay zeka dünyasından son gelişmeler, yenilikçi modeller ve dikkat çekici iş birliklerine yer verdik. Hazırsanız, mart ayının en çarpıcı haberlerine bir göz atalım!

Mistral AI’dan Yepyeni Bir Çıkış: Mistral Large — GPT-4'e Rakip Yeni Model

Mistral Large Tanıtıldı: Mistral AI, GPT-4 ve kendi sohbet asistanına rakip olacak Mistral Large modelini piyasaya sürdü. GPT-4'ün hemen altında konumlanan bu model, 32K token context windows (bağlam penceresi) ve İngilizce, Fransızca, İspanyolca, Almanca ve İtalyanca olmak üzere çok dilli destek sunuyor. Model, özellikle kesin talimatları takip etme konusunda üstün yeteneklere sahip, Daha fazla bilgi.

Microsoft, OpenAI Dışında İkinci AI İş Birliğine İmza Attı

Yeni Yatrım: Microsoft, Mistral ile 2 milyar Euro’luk dev bir iş birliğine imza attı. Bu ortaklık, Microsoft’un OpenAI’ye yaptığı büyük yatırımın hemen ardından geldi ve Mistral’de küçük bir hisse edinmeyi de içeriyor. Hemen okuyun

Apple’ın Elektrikli Araç Hayali Sona Erdi!

Project Titan Kapatıldı: Apple, elektrikli araç geliştirme hayalini rafa kaldırdı. “Project Titan” adlı projede çalışan 2.000 kişilik ekip, şimdi generatif AI projelerine yönlendirildi. Haberin detayları.

Elon Musk’tan OpenAI’ye Dava

OpenAI Tehlikesine Karşı Mücadele: Elon Musk, OpenAI’ın kuruluş misyonundan saparak Microsoft ile kar amacı güden bir ortaklık kurduğunu iddia ederek dava açtı. Dava hakkında daha fazla bilgi

Evo’nun Yenilikçi Yaklaşımı: Long-Context Modellemede Devrim

Biyolojiyi Çözümleyen Evo: Together AI ve Arc Institute tarafından geliştirilen Evo, genomlardan proteinlere kadar biyolojik verileri anlamlandırmada uzmanlaşmış bir model. 650k tokenlık bir kelime dağarcığı ile biyolojik veri analizinde devrim yaratıyor. Evo’yu keşfedin

Google'dan Uzun Context Devrimi: Gemini 1.5 Pro vs RAG Tekniği

Gemini 1.5 Pro’nun Etkileyici Yeniliği: Google’ın Gemini 1.5 Pro modeli, yapay zeka dünyasında büyük bir adım atarak 1 milyon uzunluğa varan bir bağlam penceresi sunuyor. Bu, RAG (Retrieval-Augmented Generation) teknolojisinin geleceği üzerine tartışmaları alevlendiriyor.

Towards Long Context RAG - LlamaIndex, Data Framework for LLM Applications

LlamaIndex is a simple, flexible data framework for connecting custom data sources to large language models (LLMs).

www.llamaindex.ai

TTS Arena

Gerçekçi Seslerin Peşinde: TTS Arena, hf kullanıcıların metinden konuşmaya modellerini test edip derecelendirebileceği bir olanak sunuyor. Bu, LMSys Chatbot Arena’nın konseptini takip ederek, en gerçekçi sesleri belirlemek için çeşitli sistemlerin(ElevenLabs, OpenVoice vs) karşılaştırılmasına olanak tanıyor.

TTS Arena: Benchmarking Text-to-Speech Models in the Wild

We're on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

Llama 2 ile Prompt Mühendisliği Kursu Yayınlandı

Yeni Beceriler Kazanın: Deeplearning.ai’nin “Llama 2 ile Prompt Mühendisliği” kursu yayınlandı. prompt oluşturma ve model optimizasyonu üzerine yoğunlaşıyor. few-shot ve chain-of-thought gibi ileri düzey prompt stratejileri anlatılıyor.

Prompt Engineering with Llama 2

Open up your prompt engineering to the Llama 2 collection of models! Learn best practices for prompting and building…

www.deeplearning.ai

Function-Calling Leaderboard: GPT!

Fonksiyon Çağırma Görevlerinde Yeni Lider: Berkeley Function-Calling Leaderboard, Büyük Dil Modelleri’nin (LLM) fonksiyon çağırma yeteneklerini değerlendiriyor. Bu alanda, GPT-4 şu an için zirvede yer alıyor, çeşitli fonksiyon çağırma görevlerinde liderliğini koruyor.

Introduction to Gorilla LLM

Since late 2022, Large Language Models (LLMs) have caught everyone's attention because of their capability to perform…

gorilla.cs.berkeley.edu

Büyük Dil Modellerini Kuantize Etme

Bellek ve Hesaplama Gereksinimlerini Azaltma: Bu kılavuz, büyük dil modellerinin bellek ve hesaplama ihtiyaçlarını azaltmayı amaçlayan post-training kuantizasyonun (PTQ) etkilerini ele alıyor. 125 milyon ile 180 milyar parametre arasında değişen 11 LLM ailesi üzerinde yapılan değerlendirmeler, Ağırlık, Aktivasyon ve KV Önbellek gibi bileşenlerin kuantizasyon sonrası performansını inceliyor.

Evaluating Quantized Large Language Models

Post-training quantization (PTQ) has emerged as a promising technique to reduce the cost of large language models…

arxiv.org

1-bit LLM’lerin Çağı: BitNet b1.58 ile Devrim

Ternary Ağırlıklar ve Düşük Maliyet: Yeni gelişmeler, özellikle BitNet b1.58 modeli ile, ternary ağırlıklara sahip LLM’leri ortaya çıkardı. Bu yaklaşım, gecikme, bellek gereksinimleri, veri aktarım hızı ve enerji kullanımını azaltırken, toplama işlemleri için optimize edilmiş donanımlarla GPU’ların geleneksel kullanımını da sorguluyor.

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Recent research, such as BitNet, is paving the way for a new era of 1-bit Large Language Models (LLMs). In this work…

arxiv.org

StarCoder 2 ve The Stack v2

Küçükten Büyüğe: StarCoder2, 3B, 7B ve 15B parametre büyüklüklerinde varyantlara sahip yeni bir açık kaynak LLM’dir. Kod üretimi ve anlamasında uzmanlaşmış bu model, 619 programlama dilini kapsayan The Stack v2 ile veri setini genişletiyor. 3.3 ila 4.3 trilyon tokenlik bir veri seti üzerinde eğitilmiş olan modeller, çeşitli kodlama benchmarklarında etkileyici performanslar sergiliyor.

StarCoder 2 and The Stack v2: The Next Generation

The BigCode project, an open-scientific collaboration focused on the responsible development of Large Language Models…

arxiv.org

REINFORCE ile LLM’lerde İnsan Geri Bildirimiyle Öğrenim

Basit ve Etkili Bir Yaklaşım: Yeni bulgular, REINFORCE optimizasyon yönteminin, popüler ancak karmaşık olan Proximal Policy Optimization (PPO) yönteminden daha iyi performans gösterdiğini ortaya koyuyor. REINFORCE, Büyük Dil Modellerinin (LLM) insan tercihleriyle daha iyi hizalanmasını sağlayarak, İnsan Geri Bildiriminden Güçlendirme Öğrenmesi (RLHF) sırasında etkili bir yöntem sunuyor.

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs

AI alignment in the shape of Reinforcement Learning from Human Feedback (RLHF) is increasingly treated as a crucial…

arxiv.org

MobileLLM: Mobil Cihaz Kullanım Durumları için Optimizasyon

Mobil Dünyaya Özel Dil Modeli Optimizasyonu: MobileLLM, mobil cihazlarda sorunsuz çalışacak şekilde tasarlanmış, milyarın altında parametreye sahip bir dil modelidir. Geleneksel olarak, dil modellerinin büyüklüğü ve performansı üzerine yoğunlaşılmışken, MobileLLM mimarisiyle yeni bir yolu tercih ediyor.

MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases

This paper addresses the growing need for efficient large language models (LLMs) on mobile devices, driven by…

arxiv.org

Sonuç

Ve böylece, Nane&Limon olarak hazırladığımız Mart 2024 Yapay Zeka ve NLP Bülteni’nin sonuna geldik. Mistral AI’nin yeni modeli Mistral Large’dan, Microsoft ve Mistral arasındaki büyük iş birliğine, Apple’ın elektrikli araç projesinin sonlandırılmasından, Elon Musk’ın OpenAI’a açtığı davaya ve daha fazlasına kadar bu ayki bültenimizde birçok önemli gelişmeyi sizlerle paylaştık. Yapay zeka ve NLP alanında yaşanan bu heyecan verici yeniliklerin, sektörde yeni ufuklar açacağına inanıyoruz.

Evo’nun biyolojik veri analizindeki devriminden, Google’ın Gemini 1.5 Pro ile uzun bağlam devrimine, TTS Arena’da metinden konuşmaya modellerin karşılaştırılmasından, Llama 2 ile prompt mühendisliği kursuna kadar birçok yeniliği ve gelişmeyi bültenimizde bulabilirsiniz. Teknolojinin bu hızlı evrimi, yapay zekanın sınırlarını zorlamaya ve hayatımıza daha fazla entegre olmaya devam edeceğinin bir göstergesi.

Bir sonraki bültenimizde görüşmek üzere, yapay zeka ve NLP dünyasında keşfetmeye devam edin.

Unutmayın, teknoloji ve bilim her gün gelişiyor ve bu gelişmeleri takip etmek, geleceğin şekillenmesinde önemli bir rol oynuyor. Bir sonraki bültenimizde yeni gelişmelerle tekrar karşınızda olacağız.

Bana linkedin üzerinden ulaşabilirsiniz. 🦋

Nane&Limon’dan Şubat — Mart 2024 Yapay Zeka ve NLP Bülteni: 1-bit LLM’lerin Çağı

Mistral AI’dan Yepyeni Bir Çıkış: Mistral Large — GPT-4'e Rakip Yeni Model

Microsoft, OpenAI Dışında İkinci AI İş Birliğine İmza Attı

Apple’ın Elektrikli Araç Hayali Sona Erdi!

Elon Musk’tan OpenAI’ye Dava

Evo’nun Yenilikçi Yaklaşımı: Long-Context Modellemede Devrim

Google'dan Uzun Context Devrimi: Gemini 1.5 Pro vs RAG Tekniği

Towards Long Context RAG - LlamaIndex, Data Framework for LLM Applications

LlamaIndex is a simple, flexible data framework for connecting custom data sources to large language models (LLMs).

TTS Arena

TTS Arena: Benchmarking Text-to-Speech Models in the Wild

We're on a journey to advance and democratize artificial intelligence through open source and open science.

Llama 2 ile Prompt Mühendisliği Kursu Yayınlandı

Prompt Engineering with Llama 2

Open up your prompt engineering to the Llama 2 collection of models! Learn best practices for prompting and building…

Function-Calling Leaderboard: GPT!

Introduction to Gorilla LLM

Since late 2022, Large Language Models (LLMs) have caught everyone's attention because of their capability to perform…

Büyük Dil Modellerini Kuantize Etme

Evaluating Quantized Large Language Models

Post-training quantization (PTQ) has emerged as a promising technique to reduce the cost of large language models…

1-bit LLM’lerin Çağı: BitNet b1.58 ile Devrim

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Recent research, such as BitNet, is paving the way for a new era of 1-bit Large Language Models (LLMs). In this work…

StarCoder 2 ve The Stack v2

StarCoder 2 and The Stack v2: The Next Generation

The BigCode project, an open-scientific collaboration focused on the responsible development of Large Language Models…

REINFORCE ile LLM’lerde İnsan Geri Bildirimiyle Öğrenim

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs

AI alignment in the shape of Reinforcement Learning from Human Feedback (RLHF) is increasingly treated as a crucial…

MobileLLM: Mobil Cihaz Kullanım Durumları için Optimizasyon

MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases

This paper addresses the growing need for efficient large language models (LLMs) on mobile devices, driven by…

Sonuç

Bir sonraki bültenimizde görüşmek üzere, yapay zeka ve NLP dünyasında keşfetmeye devam edin.

Written by Tarık Kaan Koç