2025年10月31日金曜日

cursor 2.0のComposer 1

ちょい前から並列エージェントにはなっていたが、
独自LLMモデルのComposer 1が、コードに関しては、早くていいらしい。

2800行の+page.svelteを指示通りに分割できるか、チェックしてみる。
どのように分割するかは指示した。


手順1が終わって次の手順が示されたが、以下の状態。
context use: 77.3%
所要時間: 5分

コンテキストが足らなくなりそうだが、このまま続行してみる。
context use: 96%


ビルドできないソースが完成された。
コンテキストがあふれたが、無視して続行。
context use: 88%


7回ぐらいコンパイル失敗したが、最終的にコンパイルが通った。
通ったものを動作確認したが、問題なし。

こういう用途ならいいかも。

2025年10月26日日曜日

LLMによる最適化を試してみたい

ShinkaEvolve

OpenEvolve


Sakana AI⁠⁠、ハイパフォーマンスなAIアルゴリズム探索フレームワーク「ShinkaEvolve」をオープンソースとして公開



2025年10月24日金曜日

eKYCの状況を簡単に説明

eKYCの状況と将来。

# 2025年06月に犯収法施行

## 犯罪収益移転防止法(犯収法)
- 現行のホ方式は2027年11月まで
- 現行の方式では、金融系は人間の目視が必要
- 新方式(ル方式)では、業種に問わず目視不要

ややこしいのが廃止して採番するので(完全に愚かな手法だが)
- ホ方式が廃止になり、2027年以降からチ方式がホ方式に・・・


最大手のLiquid KYCは2025年11月から。



## チップ読み取るだけなら自作eKYCが可能だが?
金融庁・総務省・警察庁などが定めるガイドラインに準拠している必要があります。
本人確認業務を行うには「登録本人確認事業者」や「特定事業者」の認可が必要。


一般ユーザーは、サイトが「公的に承認されたeKYC事業者を使っているか」を見抜けません。
ただし、多くの事業者は以下のような形で信頼性を示します:
サービス名の表示(例:「本人確認はLIQUID eKYCを利用しています」)
認定番号やガイドライン準拠表記
金融庁登録番号・特定事業者番号の明示
これらが明示されていないサービスでは、「形式的には本人確認をしているが、法的効力が限定的」な場合もあります。

セルフホスト可能なAIエージェント系

ノーコードフローツール(sim studio, n8n)は対象外。

OpenHandsの類似を調査。

# 要件
- VPS上で実行
- WebUI
- Python実行
- VPS上のファイルの扱い
- 認証
- LLMエージェント


候補順(OpenHandsを除く)
1. LangGaraph Platform
2. Griptape Playground
3. Dust.tt
4. AutoGen Studio: MS製
5. AgentScopre: Alibaba製
6. ChatDev / AI Town






2025年10月23日木曜日

AIブラウザやAIエージェントに管轄法務局のデータを作らせてみる実験

成果物。
https://address2houmukyoku.firemio.workers.dev/


# プロンプト
以下のURLを基準にクロール。
https://houmukyoku.moj.go.jp/homu/static/kankatsu_index.html
全ての地域から管轄法務局のデータを作る。
pythonを実行してもいいので、必ずcsvファイルで保存。

例)
都道府県, 市区町村, 不動産, 法人
"東京都", "品川区", "東京法務局 品川出張所",  "東京法務局 品川出張所"


これを
- Comet
- Fellou
- Shinkai
で行ってみる。




# Comet
  すぐ細切れにして、仕事しない・・・
  何度も言えば、そのうちやる。


# Shinkai(Gemini 2.5Pro)
  すぐさまリタイア、CSVが大きいから手動でダウンロードしろと言われてハルシネーションまみれの表示に・・・

- Shinkai(Claude 4.1 Opus)
  初回はpythonの実行エラーで止まったが、途中経過はまともそう。
  奈良県まで取得してフリーズ
  費用 $2.8


# Fellou
  START Credit:1906
  PLAN Generate: 1899
  FINISH Credit: 1504 (6min55s)

  ## 結果
  - 北海道だけで終わってしまった

  ## 追加実行
  - 全国の指示を追加
  START CR: 1504
  PLAN CR:  1493
  足らなそうなのでクレジット追加 +2000, +5000(合計約1万円)

  NEWTASK START CR: 8493
  FINISH CR: 4979

  1回実行すると8000円ぐらいかかる。
  処理は北海道から沖縄まで最後まで完遂されていた。(正しいかは未検証だが)
  取得: 2983地区

*** 日本の市町村の数は、1718(市 792、町 743、村 183)です。 ***
*** このうち、北方領土の6村を含めると1,724 ***

ということは、概ねあってるっぽいな。管轄地域は町ごとに違う場合があるので。
  

  高いな・・・ちょっと気楽に回せないな。



一番まともそうなのがFellouだった。



結論。
自分が作った専用の方が信頼できる。
6工程ぐらいあったはず、1工程が小さいしスクリプトなので確実。


オープンソースのセルフホストAIエージェント Kortix sunaを入れてみる。

Kortix suna




https://github.com/kortix-ai/suna?tab=readme-ov-file


クラウド版は

$17/month





Sandbox環境を使うには、DaytonaのAPIキーが必要。




==================================================

ℹ️  All configurations are complete. Manual start is required.

✨ Suna Setup Complete! ✨


ℹ️  Suna is configured with your LLM API keys and ready to use.

ℹ️  Delete the .setup_progress file to reset the setup.

ℹ️  To start Suna, you need to run these commands in separate terminals:


1. Start Local Supabase (in backend directory):

   cd backend && npx supabase start


2. Start Infrastructure (in project root):

   docker compose up redis -d


3. Start Frontend (in a new terminal):

   cd frontend && npm run dev


4. Start Backend (in a new terminal):

   cd backend && uv run api.py


5. Start Background Worker (in a new terminal):

   cd backend && uv run dramatiq run_agent_background


To stop Local Supabase:

   cd backend && npx supabase stop


Once all services are running, access Suna at: http://localhost:3000





起動したが・・・



localhostなのにOAuthを求められるので、無視してemailアカウントを作成したら次に行けたが・・・





なんかまともに動かんし、機能も圧倒的に足らないので終了!



オープンソースのセルフホストAIエージェント eigent.aiを入れてみる。

https://www.eigent.ai/


https://www.eigent.ai/signup?invite_code=SY4ZIVJ7184LBC


セルフホストというより、完全にデスクトップアプリだった。

ので選別から外れた。


ローカルLLMが使えるが、テンプレの文章が選択できたので、GPT-5で実行。

なかなか進まないし、ぱっと見で機能も足りない。



動いたのでスクショを取ってみる。

各エージェントがカンバン方式で並んでいる。




見た目は、なかなか良さげではある。


シンプルな使い方で、Claude Desktopに毛が生えたぐらいか?

人によってはこれで十分なのかもしれない。



クレジットは余ってるのに、



10分30秒後に、処理が途中で終わってしまった。

続きから処理を行うことができない、リプレイしかない。


とりあえずリプレイしてみるか。


ゴミ確定。

すぐにアンインストールをする!



あいうえお