最近流行りの生成AI(ChatGPTなど、言葉で指示すると文章やプログラムを作ってくれるAIのこと)を使うと、プログラミング開発の景色がガラッと変わってしまいました。
これまでは、時間をかけてコツコツ作った分だけ進捗が進んでいました。でもAIを使うと、最初の「なんとなく動くもの」を作るのが爆発的に速くなります。一瞬で「90%くらいできた!」という状態になります。
でも、ここには大きな落とし穴があります。
最近、「RPG(ロールプレイングゲーム)で、街の人全員に話しかけるのが面倒くさいな…」って思うことありませんか? 昔は楽しかったはずの「街の探索」や「聞き込み」が、なんでこんなに億劫になっちゃったんでしょう。
実はこれ、単に飽きたとかじゃなくて、私たちの**脳みそのエネルギー(認知リソース)**の問題なんです。
広いゲームの世界で、「まだ話してない人はどこだっけ?」「さっきの人はなんて言ってたっけ?」「次はどこに行けばいいの?」って考えながら動くのって、脳みそにとってはすごく大変な重労働なんです。歳をとったり、仕事で疲れていたりすると、脳みその「段取りを組む力」や「一時的に覚えておく力」が弱まってしまうので、この作業がただのストレスになっちゃうんですね。
コーディングエージェント、あるいはLLMを動かしているとき、ふと手工業的な手触りを感じることがある。たとえ最新のIDEを使い、高度な入力補完に助けられていたとしても、あるいは単一のエージェントに指示を出してその出力を待っている状態であっても、それが「ひとつ」である限り、どこか職人が手作業で彫刻を掘っているような感覚から抜け出せない。
もちろん、デバッグのように対象を凝視しなければならない場面で、処理が一つになるのは自然なことだ。けれど、もし平時においても人間が逐一監視し、次の手を指示しているのだとしたら、それはシステムによる製造というよりは、高度な道具を使っただけのクラフトワークに過ぎないのではないか。
本来的な意味でのエンジニアリング、つまり工学的なアプローチが立ち上がるのは、自分以外の何かが自律的に動き出し、しかもそれが複数同時に並走し始めたときだと思う。最低でも2つの並列処理が走り、それらが互いに協調したり、あるいは監視し合ったりしながら、全体として崩壊せずに秩序を保っている。そんな状態を作り出せたとき初めて、私たちは「書く」ことから「構築する」ことへと足を踏み入れるのかもしれない。
ユーザー: LLMで長文を生成する方法について教えてください。通常のaiサービスでは出力のサイズがある程度の長さに限定されてるような気がします。なので例えば章ごとに文章を出力しあとでマージする方法などについても考える必要があるかもしれません。また破綻なく作成するという意味合いでは画像生成の知見を利用できるかもしれません。再帰的な木のような形で領域分割しつつ破綻がないよう微調整を加えるという感じです。私を専門家と仮定して回答して構いません。
破綻のないマージを行うことについて考えてください。またどのような入力が必要かを考えてください。たとえば連載もののブログ記事や小説のようなものを品質高く作成することを考えてます。この場合はのり部分と既存のコンテキストを引き継ぐためのオーバーラップが肝になるかもしれません。