2025年12月25日木曜日
svelte5のa11yの警告をSWE-1で消せるか試す。
2025年12月19日金曜日
画像からOCRの精度
2025年年末時点でのLLMのAPI料金比較
https://www.genspark.ai/agents?id=a340f7f7-ba72-4204-9875-5c7ef4bf3783
Groqにて、
meta-llama/llama-4-maverick-17b-128e-instruct - on_demand
画像からシリアルをOCRしたが、どうやってもFをEと認識してしまう。
どうにもならない。プロンプトで調整もできなかった。
仕方がないのでKIMI latestを使う。
KIMIのAPI発行わかりにくいので張っておく。
https://platform.moonshot.ai/console/api-keys
ちなみにdeepseek公式のUIでdeepseek V3.2 chatからdeepseek-ocrを読み出せるのに、APIだとできないくさい。
どうしてもやるなら、サードパーティーでやるしか。
https://replicate.com/deepseek-ai/deepseek-vl2
あとMINIMAX-M2.1だとKIMIの価格の70%オフぐらいに激安になるのだが、プロンプトによっては問題が発生する。
「シリアルと部品番号をJSONで出力」 → センシティブな情報が含まれるので中断
「画像からOCRしなくてはいけない。」 → 読み込める。
https://platform.minimax.io/user-center/basic-information/interface-key
https://platform.minimax.io/docs/api-reference/text-anthropic-api
deepseek-OCR単体の動作
DeepSeek-OCR 価格表(プロバイダー別比較)
以下、DeepSeek-OCRの各プロバイダー別の詳細価格表です。
📊 主要プロバイダー価格比較表
| プロバイダー | 入力価格(100万トークンあたり) | 出力価格(100万トークンあたり) | コンテキスト長 | 特徴 |
|---|---|---|---|---|
| DeepInfra | $0.03 | $0.10 | 8K | 最安値、高速推論 |
| Novita AI | $0.024~$0.03 | $0.024~$0.03 | 8K | 柔軟な価格設定 |
| Clarifai | $0.20 | $0.70 | 8K | エンタープライズ向け |
| Google Cloud Vertex AI | $0.30(または$0.0003/ページ) | $1.20 | 8K | Google統合、ページ課金可能 |
2025年12月12日金曜日
Ark UI 5.12.1にてネストされたモーダルを閉じると親の影響を受ける
<症状1>
Ark UI 5.12.1にてネストされたモーダルを閉じると親の影響を受ける。
最新版: 5.15.0でも未修正。
<症状2>
取引先ピッカー自体は表示されていますが、親のArk UIダイアログのフォーカストラップが効いていて、ダイアログ外(今のPartnerPicker配置場所)へフォーカスが移動できないため、入力が一切できません。なので PartnerPickerを親ダイアログの中(DialogContentの内側)に戻して、フォーカストラップの範囲内に入れます。これで入力できるようになります。
<原因>
ArkUIでネストモーダルの処理が正常に組まれていない。
<対応>
GitHubのissueで見つけた回避策を試します。
問題の原因: Ark UIの既知のバグ
GitHubのissue(#2557)で報告されている問題と同じ。
症状
- ネストされたダイアログ(親Dialog → 子Dialog)で、子Dialogを閉じると親Dialogの動作に影響する
- Ark UI v2以降から存在するバグ
trapFocus(フォーカストラップ)の処理に問題がある
今回のケース
ProcurementDialog(親)→ PartnerPicker(子)↓子を閉じると、親のボタンが効かなくなる
結論
| 原因 | 判定 |
|---|---|
| こっちのソース記述の問題 | ❌ No |
| Ark UIの構造上の問題 | ✅ Yes |
| こっちのUI構造の問題 | ❌ No(ネストは一般的なパターン) |
対応策
- 現状維持 - PartnerPickerだけdivベースにして、他はArk UIを維持(今の状態)
- 全削除 - すべてのダイアログをdivベースに書き換え