【AI】2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは?
4: 名無しさん 2023/11/09(木) 22:08:29.38 ID:PR4ZgOtf
>>1
>研究者からはAIシステムを動かす燃料である学習データが枯渇する可能性があると懸念する声が上がっています。
なるほど
webサイトのデータも大量に取ってしまったし
しかも幾つものニュースサイトが自社のデータをAIに使うのを禁ずるというポリシーを打ち出してるからなあ
データが無いなら人を雇って作らせるしかない、か
有料でニュースやブログを書いてもらってそれを参考図書にする、みたいな
日本に関しては、国会図書館に所蔵されている全データを使った言語モデルとか
あるいはlineやmixiや「ここ」のデータもまだあまり活用され切ってないよなあw
19: 名無しさん 2023/11/12(日) 07:22:25.23 ID:ch0dHKVW
>>1
電力、マシンパワーの方が枯渇やばいだろうけど
世界のリードの1角であるグーグルのような資金があれば
気にするのはそっちの方か
まあ、数学的に識別する数が1つ増えるたびに必要なデータが指数関数的に増加する次元の壁があるのだから
ニュースはそのインスタンスの1つにすぎないわな
2: 名無しさん 2023/11/09(木) 22:01:38.89 ID:AbLyt3Hj
枯渇した後のAIの振る舞いが楽しみやん?
3: 名無しさん 2023/11/09(木) 22:04:02.90 ID:IyWoNj/c
将棋や囲碁だと人間の作ったデータだけでは
少なすぎるので自己対局で学習という方向に
なったけどLLMで同じことはできるのか
12: 名無しさん 2023/11/10(金) 17:13:57.72 ID:3IEHzV3t
>>3
ChatGPTも強化学習を使っているらしいけど
良くは知らない
5: 名無しさん 2023/11/09(木) 22:32:31.62 ID:U48jVYjT
ゴミ食わせ
出て来たゴミを
ゴミが読む