test

2025年10月31日金曜日

cursor 2.0のComposer 1

ちょい前から並列エージェントにはなっていたが、

独自LLMモデルのComposer 1が、コードに関しては、早くていいらしい。

2800行の+page.svelteを指示通りに分割できるか、チェックしてみる。

どのように分割するかは指示した。

手順１が終わって次の手順が示されたが、以下の状態。

context use: 77.3%

所要時間: 5分

コンテキストが足らなくなりそうだが、このまま続行してみる。

context use: 96%

ビルドできないソースが完成された。

コンテキストがあふれたが、無視して続行。

context use: 88%

7回ぐらいコンパイル失敗したが、最終的にコンパイルが通った。

通ったものを動作確認したが、問題なし。

こういう用途ならいいかも。

2025年10月26日日曜日

LLMによる最適化を試してみたい

ShinkaEvolve

OpenEvolve

Sakana AI⁠⁠、ハイパフォーマンスなAIアルゴリズム探索フレームワーク「ShinkaEvolve」をオープンソースとして公開

2025年10月24日金曜日

eKYCの状況を簡単に説明

の状況と将来。

# 2025年06月に犯収法施行

## 犯罪収益移転防止法（犯収法）

- 現行のホ方式は2027年11月まで

- 現行の方式では、金融系は人間の目視が必要

- 新方式（ル方式）では、業種に問わず目視不要

ややこしいのが廃止して採番するので（完全に愚かな手法だが）

- ホ方式が廃止になり、2027年以降からチ方式がホ方式に・・・

最大手のは2025年11月から。

## チップ読み取るだけなら自作eKYCが可能だが？

金融庁・総務省・警察庁などが定めるガイドラインに準拠している必要があります。

本人確認業務を行うには「登録本人確認事業者」や「特定事業者」の認可が必要。

https://www.soumu.go.jp/kojinbango_card/kojinninshou-02.html

一般ユーザーは、サイトが「公的に承認されたeKYC事業者を使っているか」を見抜けません。

ただし、多くの事業者は以下のような形で信頼性を示します：

サービス名の表示（例：「本人確認はを利用しています」）

認定番号やガイドライン準拠表記

金融庁登録番号・特定事業者番号の明示

これらが明示されていないサービスでは、「形式的には本人確認をしているが、法的効力が限定的」な場合もあります。

セルフホスト可能なAIエージェント系

ノーコードフローツール(sim studio, n8n)は対象外。

OpenHandsの類似を調査。

# 要件

- VPS上で実行

- WebUI

- Python実行

- VPS上のファイルの扱い

- 認証

- LLMエージェント

候補順（OpenHandsを除く）

1. LangGaraph Platform

2. Griptape Playground

3. Dust.tt

4. AutoGen Studio: MS製

5. AgentScopre: Alibaba製

6. ChatDev / AI Town

2025年10月23日木曜日

AIブラウザやAIエージェントに管轄法務局のデータを作らせてみる実験

成果物。

https://address2houmukyoku.firemio.workers.dev/

# プロンプト

以下のURLを基準にクロール。

https://houmukyoku.moj.go.jp/homu/static/kankatsu_index.html

全ての地域から管轄法務局のデータを作る。

pythonを実行してもいいので、必ずcsvファイルで保存。

例）

都道府県, 市区町村, 不動産, 法人

"東京都", "品川区", "東京法務局品川出張所", "東京法務局品川出張所"

これを

- Comet

- Fellou

- Shinkai

で行ってみる。

# Comet

すぐ細切れにして、仕事しない・・・

何度も言えば、そのうちやる。

# Shinkai(Gemini 2.5Pro)

すぐさまリタイア、CSVが大きいから手動でダウンロードしろと言われてハルシネーションまみれの表示に・・・

- Shinkai(Claude 4.1 Opus)

初回はpythonの実行エラーで止まったが、途中経過はまともそう。

奈良県まで取得してフリーズ

費用 $2.8

# Fellou

START Credit:1906

PLAN Generate: 1899

FINISH Credit: 1504 (6min55s)

## 結果

- 北海道だけで終わってしまった

## 追加実行

- 全国の指示を追加

START CR: 1504
PLAN CR: 1493

足らなそうなのでクレジット追加 +2000, +5000（合計約１万円）

NEWTASK START CR: 8493

FINISH CR: 4979

１回実行すると8000円ぐらいかかる。

処理は北海道から沖縄まで最後まで完遂されていた。（正しいかは未検証だが）

取得: 2983地区

*** 日本の市町村の数は、1718（市 792、町 743、村 183）です。 ***

*** このうち、北方領土の6村を含めると1,724 ***

ということは、概ねあってるっぽいな。管轄地域は町ごとに違う場合があるので。

高いな・・・ちょっと気楽に回せないな。

一番まともそうなのがFellouだった。

結論。

自分が作った専用の方が信頼できる。

６工程ぐらいあったはず、１工程が小さいしスクリプトなので確実。

オープンソースのセルフホストAIエージェント Kortix sunaを入れてみる。

Kortix suna

https://github.com/kortix-ai/suna?tab=readme-ov-file

クラウド版は

$17/month

Sandbox環境を使うには、DaytonaのAPIキーが必要。

==================================================

ℹ️ All configurations are complete. Manual start is required.

✨ Suna Setup Complete! ✨

ℹ️ Suna is configured with your LLM API keys and ready to use.

ℹ️ Delete the .setup_progress file to reset the setup.

ℹ️ To start Suna, you need to run these commands in separate terminals:

1. Start Local Supabase (in backend directory):

cd backend && npx supabase start

2. Start Infrastructure (in project root):

docker compose up redis -d

3. Start Frontend (in a new terminal):

cd frontend && npm run dev

4. Start Backend (in a new terminal):

cd backend && uv run api.py

5. Start Background Worker (in a new terminal):

cd backend && uv run dramatiq run_agent_background

To stop Local Supabase:

cd backend && npx supabase stop

Once all services are running, access Suna at: http://localhost:3000

起動したが・・・

localhostなのにOAuthを求められるので、無視してemailアカウントを作成したら次に行けたが・・・

なんかまともに動かんし、機能も圧倒的に足らないので終了！

オープンソースのセルフホストAIエージェント eigent.aiを入れてみる。

https://www.eigent.ai/

https://www.eigent.ai/signup?invite_code=SY4ZIVJ7184LBC

セルフホストというより、完全にデスクトップアプリだった。

ので選別から外れた。

ローカルLLMが使えるが、テンプレの文章が選択できたので、GPT-5で実行。

なかなか進まないし、ぱっと見で機能も足りない。

動いたのでスクショを取ってみる。

各エージェントがカンバン方式で並んでいる。

見た目は、なかなか良さげではある。

シンプルな使い方で、Claude Desktopに毛が生えたぐらいか？

人によってはこれで十分なのかもしれない。

クレジットは余ってるのに、

１０分３０秒後に、処理が途中で終わってしまった。

続きから処理を行うことができない、リプレイしかない。

とりあえずリプレイしてみるか。

ゴミ確定。

すぐにアンインストールをする！