優しくない増田ばかりなので、なんで意味がないと言われるか説明するね ..

優しくない増田ばかりなので、なんで意味がないと言われるか説明するね

基本的に、学習前には集めたデータのフィルタリングを行うので、ゴミはそもそも除外されることが多いんだ

分類条件は、画像サイズだったり、画像と説明文の一致度だったり、色々ある

そうして何度かろ過されたものが、学習に使われるデータセットになるんだよ

なので、せいぜい画像のダウンロードやフィルタリングの時間を一瞬伸ばせるくらいの効果しか見込めない

ただAI 検索のような、生成時に検索を行うAIが、正しい回答を出力する邪魔はできる

これの難点は、人間にとってもノイズになるという事だね

AI 画像や人力デマが検索上位に出てくると困るように、AIの邪魔になるということは、人間の邪魔にもなるんだ

ところで画像生成モデルは、色んな画像の色んな特徴を学習して、その学習結果を元に生成するんだよね

つまり、ゴミをゴミとして学習できていると、ゴミから適切に距離を取ることも可能になるんだ

だから、ゴミ画像ばかり集めて、ゴミから距離を取るために使うモデルというものもあるよ

例えば僕達は、進行ルート上にウンコが落ちてたら、避けるでしょ？

それは、僕達がウンコという物質を学習していて、できれば踏みたくない、忌避すべきものだと思っているから

これは生成AI的に言うと、negative prompt: poop が与えられている状態と同じなんだ

でも、ウンコ研究家なら近寄って採取することもあるよね

なので、場合によっては有益なデータとして見ることも可能ですらあるの

というわけで、「全く効果がない」は単純化しすぎだけど、人間にも迷惑だし、基本的には無益な行為と言える

「たとえ自分の時間その他コストを支払ってでも、気に食わないアイツが損するならそれでいい！」という思考の人以外にはおすすめできないかな

2024-11-17