2026年4月5日日曜日

LLMのCLI系のレートリミット

大量のデータをスクレイプして分析する要件。
claudeのproxyもたまにweb_search失敗するので、chromeプラグインにフォールバックするのが筋のいい手法となる。

claude max plan $200じゃ、すぐに週間レートリミットで使えなくなる。
40分ぐらいで1週間分を使い果たしてしまう。

ちなみにclaude初期にかなり課金してるので、Tierは一般人としては最高ランク。
それ以上はエンタープライズ契約じゃないと無理だ。

仮にエンタープライズ契約しても、コストが合わない。
コスト削減の為にkimi版を試してみたが、大きな問題はなかった。

一番安いコストはDeepSeekなのだが、少し問題がある。
DeepSeekの公式UIだとweb_searchできるが、APIは無理なのでなにかしら串が必要となる。
公式UIをガンガンに使ったら絶対怒られるので、やめておく。

kimi coding plan $199だと数日持つが、それでも無理がある。
kimi cliはmoonshot API版も使えるので、切り替えて使おうと思う。



# web_searchの違い
CLI標準の SearchWeb → codingplan 側専用
API側の web search → Open Platform の API機能として別実装


※補足
Moonshot Open Platform の builtin な $web_search は thinking を無効化して使う必要がある。安定化の為らしい。
thinkingが無効といっても、まったく推論しないわけではない。深い推論モードじゃないだけ。






0 件のコメント:

コメントを投稿

あいうえお