#585 AIが求める新しい情報 / 人間が減らす共有の習慣

今のLLMはその学習のソースに、どのくらいインターネットのデータを使っているのかはわからない。インターネットのデータは玉石混交だからだ。もしかしたらどこかで公開されているのかもしれないけど、少なくとも自分は知らないが、たとえばChatGPTはどのくらい使っているのか。
わからないので仮定の、もしくは抽象化した話として。
ChatGPTに何かの実装方法を聞くとそれなりに答えてくれる。間違ったコードも出すが、正しいコードもそれなりに出す。他の代表的なLLMについても同様だ。
あ、もう3分が経過してしまった。早いな。やはりキーボード入力だと遅い。あと冒頭でちょっと考える時間が入っていたし。流石に短すぎるので延長する。そして音声入力に切り替える.
結論から言ってみよう結論から言うと何を言いたいのかというと学習データをAI 開発企業がお金を払って作るようになるのではないかということ.
まあすでにインターネット上のデータはもう使い終わってしまったという話があるしすでにデータ自体を作るということには色々苦心しているしやっているんだろうけれども.
まあその話話すの延長として何だろうな例えば今スタックオーバーフローへの記事の投稿数が減っているみたいな話があって確かに自分が苦労して何かわかったことそれがもし車輪の再発明的なものだったとしても苦労して何か知ったこととかもしくはどこかネット上に情報がもしあったとしてもそれを知るためにちょっと苦労したり複数の記事を組み合わせないと解決しなかったりしたことは個人的にはそれはブログに書いていいと思ってるし例えば支度をオフロードにそういう解決策の情報があっていいだろう.
けれどもそういった 組み合わせたり 探したりということを AI がやるようになるとそこにかける自分のコストというものは低いしそしてそんなコストが低いことをどこかに書くコストを別に人間を払わない.実際にあまり意味もないと思うしね.
そして今の技術 今必要な技術 今使われてる技術 の情報はまだ ネット上にたくさんある状態で AI というものが成立している時代だけれども.じゃあこれからこれから出てくる新しい技術の情報はどこから得るんだろうかという話になる.
情報 新しい情報とかもしくはその AI が持っていない情報みたいなものは人間は相変わらずブログに書いたりするのではないかという気持ちもあるがそうするとしてはなんとなく減るような気がしている.
それはそういう新規性があることばかりだけ書くというのは難しいというかなんかその習慣みたいなものが減るような気がしていて思ってるんだけどももちろんゼロにはならないと思っているんだけれどもなんとなく総数として減ってしまうような気がしていてそうするとまあ AI 開発 企業側も困るので結局はそういうAI のために 文章を書いたり AI のために今はまだない ジャンルの情報を書いたりするという仕事がもうおそらく存在するやってるんだろうけれどもそれがもっと大規模にそしてパブリックにある程度クローズにやっているスケールでは間に合わなくなってパブリックにやるようなのではないかなと思う.
とはいえそこに悪意が紛れ込む可能性もあるので今のオープンソースのような仕組みで防ぐしかないのかもっといい方法があるのか.
なんとなく良い切り口のことを思いついてメモをしたような気になっていて書き始めてみたがいざ書き始めてみると特に新規性がない意見のようなものになっていてこれは面白いかな書いてみたらがっかりだったみたいなことでそれはそれで面白いかなと感じている.
コメントを残す