2026年3月21日土曜日

現代のLLMはすごい

GPT-5.4でdraw.ioのデータを、PDFとWordに変換するコードが出来てしまった。

変換に微妙にコツはあるが、近似でほぼ同じものができあがる。

均等割り付け文字までできちゃう。


2年前は、この精度で出せるのは無理だった。









ちなみにOpenClaw (GLM-5 coding plan) で有名人リストから死亡日を入力させるのを、やってみたが雑に動いてるっぽい。

OpenClawに特化したGLM-5-Turboではなく、デフォルトのGLM-5を使った。


とりあえず入れたスキル
self-improving-agent(ナレッジ)
Agent Browser(スクリーンショット認識)













うーむ現代のLLMはすごい!

清華大学やべぇな。かなり激安なのに使えるっぽい?

バックグランドで実行すると言ってきたので、そのようにした。
状況を確認すると即座に処理件数が返ってきた。

状況表示したら500件で死んだくさい。

Capability Evolver(失敗したとき、自己修復できるっぽい)
を入れて実行したら、スクリプトを実行しつづけて、応答不能になった。

/newで始めたら、何もかも忘れやがったので、BOOTSTRAPで記憶が残るようになったっぽい。

ついでに、glm-5-turboに乗り換え、自己修復で再実行した。

自己修復前の実行は状況表示は即座に応答あったのに、
自己修復実行後は長い処理の途中で、停止できないし割り込めないしで、結構使いにくい。
途中であらぬ方向に行くとき、起動修正ができない。
失敗が確定しないと、次の行動を直せない。

そのための、Capability Evolverなのかもしれんが・・・
単純ループはループを小さくして、応答受けつけするのがコツかもしれない。

もしかしてバックグランドで起動してないのか?チャットセッションで起動してんの?よくわからん。

明示的にサブエージェントで指示するべきだったのか?


長時間のタスクは、OpenClawはデフォルトでタスクが10分で強制終了してしまう。
・タイムアウトを伸ばす
・細かく終了させる
・再実行させる
これらをやらないと、うまく動かん。


firebase config

functions.config() は 2026年3月以降デプロイ不可になるため、

dotenvかsecret managerに移行しなくちゃいけない。


composer2

cursorの新モデルcomposer2が出てたので、触ってみた。

ちょっと複雑なバグも直してしまった。
すごいかも・・・


同じような機能、実装Aと実装Bがあり、実装Bにバグがある、実装Aを元にすれば直せる状況。



動作を見ると
grep -> thinkingをひたすらループし、かなり最適に答えにたどり着いていた。




Composer 2の料金 (100万トークンあたり)
  • スタンダード版:
    • 入力 (Input): $0.50 (約75円)
    • 出力 (Output): $2.50 (約375円)
  • 高速版 (デフォルト):
    • 入力 (Input): $1.50 (約225円)
    • 出力 (Output): $7.50 (約1,125円)








2026年3月16日月曜日

claude codeで関係ないファイルを勝手に書き換える、謎の処理。


1つのファイルしか修正する必要がないのに、
なぜかpackage.jsonの最後の、 } 閉じ中括弧を削除していた。


プロンプトに localhost:5174があったから、なのか?

やたらスキルを入れているが、そのせいなのか???

これ原因を調べるのめんどくさいな。

プロンプトインジェクションではないと思うのだが・・・





最初は5分ぐらいで修正したのに、
2回目は30分経っても修正できない。



なんだこれ?

2026年3月15日日曜日

ちょっとしたRAG的なものが欲しいのだが・・・

Anthropicは完全にRAGから脱却し、Agentic Searchをしている。

これを小さい規模でできるのか?




AutoGen + GraphRAG
https://zenn.dev/secondselection/articles/autogen_graphrag



2026年3月14日土曜日

genspark speaklyが動かない

数日前から、まともに動作しない。

ダウンロードもできない。
https://speakly.ai/ja/#

なんだこれ?




仕方がないので、Amicalを入れたが、俺のマシンだとAmicalすら動かん。
クラウド版すら選べん。
ONNX Runtimeが競合しまくり。
ONNXをいろいろ使った覚えがあるが、どのプロジェクトかチェックするのがだるい。





とりあえず nivida studio driverを入れなおしてみる。

直った!



2026年3月12日木曜日

電車の空気ばねで混雑状況がわかるとか

JR東日本のスマホアプリじゃ使いにくいので、以下を登録したが、2日かかる。

https://developer.odpt.org/



のでAIに聞いてみた。



JRを含む**「混雑状況(congestion / crowding)」**は、日本では実はかなり特殊で、リアルタイムAPIはほぼODPTしか公式に存在しません。
そのため開発者は実務では次の 3つの方法のどれかを使います。

① ODPT(唯一の公式リアルタイム混雑API)
問題点
APIキー審査(通常1〜2日)
レート制限あり


② JR東日本オープンデータ(登録不要)
East Japan Railway Company が公開。
ただし リアルタイムではなく統計。
時間帯別混雑率
路線別混雑ランキング


③ 非公式(実務で多い)
スタートアップや研究ではこれ。
方法
アプリのAPIを解析



ODPTしかないんだね。


あいうえお