大規模言語モデル(LLM)

  • ChatGPT

  • local

  • Prompt

  • Hallucination Problem

大規模言語モデルのランキング(LLM) Ranking

Artificial Analysis

AI言語モデルおよびAPIの独立分析。品質、速度、価格の比較を提供します。


大規模言語モデル

クローズドソースモデル:

OpenAI's new o1 model, released on September 12, 2024, is now the most powerful LLM that can reason through complex problems by breaking them down into steps, excelling particularly in areas like mathematics, coding, and scientific reasoning where it outperforms previous models and even rivals human experts in some cases.

OpenAI o1 and o1 pro

https://openai.com/index/learning-to-reason-with-llms/

オープンソースの大規模言語モデル:

DeepSeek v3は、6710億パラメータを搭載した先進的なオープンソースの大規模言語モデルで、卓越した性能とコスト効率を兼ね備えています。これにより、OpenAIやGoogleといった大手企業のクローズドソースモデルに対する有力な代替オプションとして注目されています。

https://github.com/deepseek-ai/DeepSeek-V3


学習リソース:

Transformers, Explained: Understand the Model Behind GPT-3, BERT, and T5

LLM101n: Let's build a Storyteller

Generative AI Handbook: A Roadmap for Learning Resources

Deep Dive into LLMs like ChatGPT by Andrej Karpathy

KarpaHow I use LLMs by Andrej Karpathy

Google - Prompt Engineering by Lee Boonstra

Last updated

Was this helpful?