2025年10月23日木曜日
AIブラウザやAIエージェントに管轄法務局のデータを作らせてみる実験
オープンソースのセルフホストAIエージェント Kortix sunaを入れてみる。
Kortix suna
https://github.com/kortix-ai/suna?tab=readme-ov-file
クラウド版は
$17/month
Sandbox環境を使うには、DaytonaのAPIキーが必要。
==================================================
ℹ️ All configurations are complete. Manual start is required.
✨ Suna Setup Complete! ✨
ℹ️ Suna is configured with your LLM API keys and ready to use.
ℹ️ Delete the .setup_progress file to reset the setup.
ℹ️ To start Suna, you need to run these commands in separate terminals:
1. Start Local Supabase (in backend directory):
cd backend && npx supabase start
2. Start Infrastructure (in project root):
docker compose up redis -d
3. Start Frontend (in a new terminal):
cd frontend && npm run dev
4. Start Backend (in a new terminal):
cd backend && uv run api.py
5. Start Background Worker (in a new terminal):
cd backend && uv run dramatiq run_agent_background
To stop Local Supabase:
cd backend && npx supabase stop
Once all services are running, access Suna at: http://localhost:3000
起動したが・・・
localhostなのにOAuthを求められるので、無視してemailアカウントを作成したら次に行けたが・・・
なんかまともに動かんし、機能も圧倒的に足らないので終了!
オープンソースのセルフホストAIエージェント eigent.aiを入れてみる。
https://www.eigent.ai/
https://www.eigent.ai/signup?invite_code=SY4ZIVJ7184LBC
セルフホストというより、完全にデスクトップアプリだった。
ので選別から外れた。
ローカルLLMが使えるが、テンプレの文章が選択できたので、GPT-5で実行。
なかなか進まないし、ぱっと見で機能も足りない。
各エージェントがカンバン方式で並んでいる。
見た目は、なかなか良さげではある。
シンプルな使い方で、Claude Desktopに毛が生えたぐらいか?
人によってはこれで十分なのかもしれない。
クレジットは余ってるのに、
10分30秒後に、処理が途中で終わってしまった。
続きから処理を行うことができない、リプレイしかない。
とりあえずリプレイしてみるか。
ゴミ確定。
すぐにアンインストールをする!
オープンソースのセルフホストAIエージェント observer-aiを入れてみる。
https://github.com/Roy3838/Observer
入れなくても、クラウド版で軽く試せる。
https://app.observer-ai.com/
・WebUI有
・ローカルファイル参照???
・ログイン機能???
「Agent Tools」はメモリや通知中心で、FSは用意されていないため、自前拡張が前提。
openhandsみたいなのを探している。
・ブラウザ上で動作する
・外部公開可能
・ログイン必須
・VPSで実行して、VPS上のファイルを操作できる
オープンソースのセルフホストAIエージェント Shinkai(新海)を入れてみる。
オープンソースのセルフホスト可能なAIエージェント
ツール名 | ローカルCSV解析 | 補足 |
---|---|---|
OpenHands | ○ | ファイルをWebUI/CLIから読込→Python等で解析可能 |
Eigent | ○ | 複数エージェントがPythonで柔軟に解析。設計次第で高度分析も可 |
Suna | ○ | WebUIにCSVアップロード→解析やグラフ化も可能 |
Observer AI | ○ | Jupyter等連携可。直接ファイル指定してLLM解析できる |
Shinkai | △ | 基本はアプリ拡張で対応。標準機能は限定的 |
ツール名 | パブリック公開 | ログイン機能 | 補足 |
---|---|---|---|
OpenHands | △ | △ | ローカル公開は可。認証は自作or外部連携が必要 |
Eigent | △ | △ | 管理画面で制御可。認証機能はOSS追加対応のみ |
Suna | ○ | ○ | 標準WebUIで公開+ユーザー管理&認証搭載 |
Observer AI | ○ | ○ | WebUIでパブリック公開&認証(ユーザー管理)対応 |
Shinkai | ○ | ○ | WebUIアプリ公開時にアカウント管理機能付き |
2025年10月19日日曜日
openhandsの覚え書き
2025年10月17日金曜日
SWE-grep
Devinを作ってるcognitionが作った並列実行grep RAGのモデルらしい。
マジで中身よくわかってない・・・
Windsurfからでも使える。
https://cognition.ai/blog/swe-grep#where-to-try-fast-context
どうやら早いらしい。
2800TPSで、今までのwindsurfのgrep agentより20倍速いとかなんとか。
2025年10月16日木曜日
AIエージェントで楽にスクレイプが可能か検証
## ツール検証
現在(2025/10/16)において、各種AIエージェントがあるが、実験したものを記す
## リサーチAgent系
- Perplexity スクレイピングに向かない。
- Genspark Perplexityよりマシだがスクレイピングに向かない。
- Comet 不安定でスクレイピングに向かない。
## クラウドブラウザ系
- director.ai(Browserbase)
- 全部クラウドで動作し便利だが、ややコストが高い。(0.1ドル/時間 )
- 非エンジニアでも使える
- 自動実行ができないっぽい(webhookもない)
- データベース連携ができない
- チームメンバーも招待できる
- 有料でProxyも使える
- 開発者向けというより事務員向け
- Firecrawl
- この用途に最もあっている気がするが、あまり好きじゃないので評価をスルー
- apify.com
- apify/website-content-crawler
- easyapi/website-content-to-markdown-for-llm-training
- AI時代に向いてるコンテキストクローラーとしてかなり優秀だが、コストが高すぎる!!!5分で$0.202かかってしまった。
- 自動実行可能
- データベース連携可能
- クロールしたページ内でコンテキストの整理ができないっぽいので、今回の用途に向かない(簡単にいうとページのここの表だけを使いたいとか)
- Diffbot
- 不安定で使い物にならない
# 結論、専用のスクレイパーを汎用性を持たせて自分で作った方がいい。
2025年10月15日水曜日
2025年10月14日火曜日
LinuxのAppimageでLedger Nano S Plusを管理する。
2025年10月13日月曜日
trigkey N95のファンが不調
2025年10月8日水曜日
2025年10月3日金曜日
firebase studioなどでソースをダウンロードする
caddyが遅いので調べた
Pingoraは高負荷対応に特化したRust実装の最先端プロキシです。
Ferronは実績はまだ限定的ながら、Rust製でCaddyを超える速度を謳う注目プロジェクトです。
Caddyは機能と使いやすさで人気ですが、大規模性能は他に劣ります。
Nginxはスループットと安定性の両面でいまだ強豪です。
Traefikは動的設定、クラウドネイティブに優れますが処理能力は中間程度です。
以上のような特徴と性能傾向の比較になります。実運用や用途に応じて選択するのが最適です。こちらが主要なリバースプロキシの性能比較の簡潔な表です。
プロキシ名 | 最大処理件数 (requests/sec) | レイテンシ | 実装言語 | 特長・コメント |
---|---|---|---|---|
Pingora | 約48,000 | 非常に低い | Rust | Cloudflare製、大規模トラフィック最適化 |
Ferron | 約30,000〜未確定(参考値) | 低め | Rust | 日本コミュニティ注目、Caddyより高速 |
Caddy 2.9 | 約18,000〜20,000 | やや高め | Go | 自動SSL、HTTP/3対応、設定が簡単 |
Nginx | 約41,000 | 低め | C | 高スループット、成熟した運用実績 |
Traefik | 約26,000 | 標準~やや高め | Go | Kubernetes連携強み、動的設定対応 |
この比較はあくまで参考値であり、環境・設定によって変動しますが、Rust製のPingoraとFerronは特に高性能かつ低レイテンシが特徴です。Caddyは機能性重視、Nginxは安定性と高スループット、Traefikは動的環境対応が特徴となります。