2025年5月23日金曜日

windsurfでclaude4対応

windsurf バージョン 1.9.2


BYOK(Bring your Own Key)

自分のAnthropic APIキーを使ってclaude4を使えるように!

やったぜ!

codexとclaude sonnet 4で便利になる。


<Anthropic API>

https://console.anthropic.com/settings/keys


<Windsurf API setting>

https://windsurf.com/subscription/provider-api-keys





2025年5月20日火曜日

codex(chat-gpt)にて、マルチリポは非対応。


マルチリポは非対応。



「ネットワークがないためサブモジュールを取得できない。」




仕方がないので、モノリポにしてみる。


2025年5月18日日曜日

codexでパターンの問題を解く


ある記号列が、どのようなアルゴリズムでなりたっているかを解く。

- BigEyeRoadEvaluator, SmallRoadEvaluator, BeeRoadEvaluatorを使い判定をする。
  例)
  PBBBPPBPBBBPPBBBの時  
  smallroad: 誤誤誤誤誤正誤誤誤正正
  beeroad: 正誤正誤誤誤誤誤正


入力と結果を与えると、ひたすらユニットテストしてごり押しで問題を解いてしまった・・・

すごい!すごすぎる!!

グループ化のアイデアは先に与えておいたのだが、

ごり押し天才プログラマーじゃんか。

最初AGENTS.mdを用意してなかったので、評価コードを使ったり、コードベースからシミュレーションしたり揺れがあった。

コードベースからシミュレーション(コードフローを追う、人間で言うところの机上トレース)、これは1つ評価するのに3分以上かかった。





# スモールロードの判定
- 勝敗履歴から Tie(T)を除いた B/P の並びを同じ記号ごとにまとめた「グループ」を作り、常に直近のグループを評価対象とします。
- グループ数が 3 未満、または三つ目のグループの長さが 2 未満の場合はマーカー無し。
- 直近グループが長さ 1 のときは、2 つ前と3 つ前のグループ長を比較します。両方が長さ1なら「誤」、それ以外は長さが等しければ「正」、違えば「誤」。
- 直近グループが長さ2以上なら、2 つ前のグループより短い、または差が2以上なら「正」、それ以外は「誤」。

# Bee Road の判定
- 基本はスモールロードと同じ処理を offset=3 で行います。
- グループ数や三つ目のグループ長が条件を満たさない場合はマーカー無し。
- 直近グループが長さ1のとき、最初のマーカー判定では1つ前と2つ前のグループ長が異なれば「正」、同じなら「誤」。マーカーが既にある場合は両方が長さ1なら「誤」、そうでなければ長さが等しければ「正」、違えば「誤」。
- 直近グループが長さ2以上なら、3つ前のグループより短い、または差が2以上なら「正」、それ以外は「誤」。


2025年5月17日土曜日

codex(chat-gpt)でリファクタリングができるのか評価してみる


https://chatgpt.com/codex



3.7 sonnetでメインループが存在する系のコードを書いて、一応完成させた。

だが、こんなの実際の人間は組まないよなー って感じの冗長化されたコードになっている。

フラグを複数管理すれば、もっとシンプルに書ける。



コードも長くなるし見通しも悪いので、codexでリファクタリングしてみるテスト。



<プロンプト>

cyber_grid_v2, big_eye_road, small_road, bee_road, game_history
これらをベストプラクティスに基づきリファクタリングしてください。
cyber_grid_v2は10目や3目が組み込まれてしまっている。

今の操作関連と表示処理は完璧なので、この動作を壊さないようにしてください。
全体的に無駄な処理がおおく、処理の流れが悪いように思えます。

例えば入力履歴が1つあれば、すべて復元できるのに、1個1個addしたりするのがおかしいように思える。
処理の流れが単純化していないので、冗長なメインコードになってしまっている、こんなのフラグ管理をするだけで、もっとシンプルにわかりやすく実装できる。







1分30秒ほど評価したあと、5個のタスクが作られた。
ここの評価で口をはさむことは、もうできない。


ここで完全に分離したタスクとして実行できるのが効率がいい。
本当に互いに疎結合として判断できてるのか、怪しい気がするが・・・







一番長いタスクで10分ほど、

ここまでの所要時間20分ぐらいで、一応リファクタリングが終わった。

さて、動作は?


※疎結合として判断してない、規模が大きいとき処理順を間違えるとコンフリクト起こすので注意!

まぁ仮にマージコンフリクト起きても、再度リファクタすればいいのだが・・・
codexがgit操作しまくってパッチを作ってくれるが、手間なので、なるべく起こさなようにした方がいい。



たまに失敗する。










結果として、とりあえずリファクタリングは完了した。

だが、メインループ系の冗長的な処理はまったく改善することはなかった。

やらないより、やった方が少しマシって程度。


だが、見つけにくい致命的なバグを生み出してしまっていた。

結果リファクタリングは失敗したので、失敗したものをさらに直してみる。


もう一度しつこくリファクタリングの指示をしてみる。




これは致命的なバグです。 他の下部3セクションにも影響します。 なぜこんな事がおきたのかも説明してください。




動作ログを見ても説明がない。
プルリクにも説明がない。
プルリク前のまとめにも説明がない。


直ったが、完全にブラックボックスになってしまった・・・
いまのところソースの評価はローカルIDEでやった方がいい。



2025年5月16日金曜日

LinuxMint 22.1でWayland有効だとRustDeskが動かない


LinuxMint 22.1でWayland有効(試験的機能)だとRustDeskが動かない

そして、Intel HD Graphicsも、

古いOpenGLで書いても、内部的に変換処理はされない。


2025年5月15日木曜日

trigkeyのN95の奴

監視カメラを9台録画、2TのSSDを増設し常時稼働で2年経った。

動作に支障はないが、ファンから異音がする。
せっかくの静音マシンなのに・・・

開けたが、露出しているわけじゃないので直すのが面倒。

軸受けの耐久がよくない模様。



まぁ2万以下で十分元は取ってると思う。


あいうえお