AIスタートアップのSakana AIは、LLMによって発見、記述された新しい選好最適化アルゴリズムである「DiscoPOP」を発表した。「DiscoPOPの研究は、AIの自己改良プロセスを実現するために最新のAIを利用するアプローチが大きな可能性を持つことを示している」と述べている。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
日本のAI(人工知能)スタートアップ企業であるSakana AIは2024年6月13日、LLM(大規模言語モデル)によって発見され、記述された新しいSOTA(State-of-the-Art〈※1〉)選好最適化アルゴリズムである「DiscoPOP」を発表した。
Sakana AIは、オックスフォード大学、ケンブリッジ大学と協力し、DiscoPOPの成果をまとめた論文「Discovering Preference Optimization Algorithms with and for Large Language Models」(LLMによるLLMのための選好最適化アルゴリズムの発見〈※2〉)を発表した。また、この研究の発見プロセスを実行するためのコードベースを、GitHubとHuggingFaceでオープンソース化した。
※1 「現時点での最先端レベルの性能を達成している」ことを指す
※2 Discovered Preference Optimization:発見された選好最適化
Sakana AIは、DiscoPOPアルゴリズムを生み出した同社の手法を以下のように要約している。
これらの中で最も優れたものがDiscoPOPと呼ばれる。
Sakana AIは、DiscoPOPの研究背景を次のように説明している。
Copyright © ITmedia, Inc. All Rights Reserved.