https://t.co/J262Wk7ByR LLMリーダーボードが新しくなりました!一問一答形式での言語理解と、プロンプト対話での文章生成能力を総合評価を行う日本語性能ランキングの決定版です。W&Bレポート機能を使ってその場でモデル比較分析を行うことができます。話題のモデルをどんどん追加していきます!… pic.twitter.com/CELIkkn1YT — シバタアキラ (@madyagi) December 27, 2023 この新しいバージョンの開発に際しては、LLM-jpのモデル評価チームや、Stability AI Japan の評価チームの皆さん、弊社内LLMエクスパートチームなどとのディスカッションを経て日本でLLM開発・提供をされている方々にとってフェアで、広く役に立つ評価方法の構築を心がけました。 7月に初期バージョンを公開してから、数多くのモデルがリリースされ、私