Son günlerde tekrardan local llm'lere sardım
Kendi rp chatbotumu kullanıyorum şu sıralar SillyTavern üzerinden. Mistral'in modlanmış Ai'leri gayet iyi çalışıyor. Aynı zamanda localde çalışan, çeviri için kullanılabilecek modellere de bakıyorum. Aralarından en iyi çalışanı sanırım meta'nın geliştirdiği nllb modeli en ideali. 3.3B bağlamıyla beraber sistemi de o kadar fazla yormuyor fakat uzun metinlerde kötü bir performans sağlıyor. Unsloth ile Fine-Tuning yapıp çatallayarak paylaşabilirim belki daha sonrasında.
Son dönemlerde bütün yapay zekaların(güncel olarak gemini kullanıyorum) pro modellerinde dahi kullanılabilecek token sayısı inanılmaz derece azalmış. Normalde 50-60 prompt girebildiğim Gemini pro, özellikle son haftalarda 10-15 promptta doluyor bu sebeple yerelde çalışan modelleri deniyorum.
İleride bende local llm leri kullanmayı düşünüyorum. Intel GPU lu(vram), sunucu olarak kullanacağım bir bilgisayar toplayacağım.
Geminiye evet birşeyler olmuş. AI studiododan limitsiz(yani varsa limiti bilmiyorum) kullanıyordum pro previewi bir anda bikaç kez kullanınca bitmeye başladı.
Gemini üzerinde pro planı kullanıyorum uzun zamandır. Şu ana kadar ultra versiyonuna geçmemiz için bir ibare yokken özellikle 2 haftadır her girişimde sağ üst tarafta gemini ultraya geçin şeklinde bir ibare var va aşırı rahatsız edici. Hali hazırda 5070'li bir bilgisayarım var fakat 16gb ram olduğu için 24B'lik llm'leri kullanamıyorum. Deneyimlediğim kadarıyla en stabil çalışanlar Qwen ve mistral. Henüz bütün işleri görmüyorlar fakat gelecek vadeden bir yapıda bulunuyorlar.
Kotaları da ai studio ve antgravityde baya sıktılar ha bire yarıda kesilip uyarı veriyor
Evet. O yüzden Claude'a geçtim. Elbette kullanım ömrü çok daha az fakat en azından ne kadar kullandığımı ve ne kadar daha kullanabileceğimi gösteriyor.