大規模言語モデル(Large Language Model: LLM)は、ディープラーニング技術で訓練された人工知能システムであり、膨大な量のテキストデータ(書籍、ウェブページ、コード)を読み取ります。
3つの大きな特徴があります。
– 大量に読み込む:読み込む情報量は、人間が一生かかっても読み切れないほど大量にある。
–パターン検索: 単語を記憶するのではなく、言語の背後にある確率やパターンを学習する。
–パターン探索: 単語を記憶するのではなく、言語の背後にある確率やパターンを学習する。
– 膨大なパラメータ: 脳は何億、何兆ものパラメータ(神経接続)で構成されている。
