runesleo

vip
期間 8.3 年
ピーク時のランク 6
現在、コンテンツはありません
PM 做不出钱的人里,有相当一部分不是看不准事件,是不会下单。
具体讲:
Polymarket 用的是限价订单簿(CLOB · central limit order book),不是 AMM(自动做市商)。
你看到的 0.51 是当前最低卖单价,不是"市价"。
按市价吃单 = 一档一档往上扫。
举例:盘口深度 $200 / 0.51,往上还有 0.52 / 0.55 / 0.6……
你下 $1000 进去,平均成交可能在 0.56。
5% 隐性滑点。
事件你看准了,PnL 还是负的——根因不是分析错,是 size 超了盘口深度。
3 个新手最容易栽的:
1. 默认市价单 → 全场扫盘
2. 看 spread(价差)不看 depth(深度)→ 0.51/0.52 看着窄,每档只 $50 你吃不下
3. 不看 taker fee → Polymarket 3 月底全面启用 taker 手续费(吃单方手续费,按品类 0-1.8% 不等),长跑下来吃掉一截边缘
正确做法:
- 流动性好的市场(>$10K 日成交):限价单挂 best ask(最优卖价)附近,等 maker(撮合方)撮合
- 流动性差的:分批吃,每次只吃当档深度的 50%
- 永远先看 orderbook(订单簿)深度,再决定 size
——
我跑 prediction-trader 早期就栽过:H36 这条策略 3/31
  • 報酬
  • コメント
  • リポスト
  • 共有
Polymarket V2 今週からデザインを切り替え、グループ内の議論はユーザーレベル(USDC.e は pUSD に戻さない / 間違ったチェーンに送金して資金を失う)に集中していますが、エンジニアリングの面では静かに問題が潜んでいます。
私自身もトレーダーとして今週切り替えを進めています。V1 から V2 への切り替えのための汎用 SOP を提供します。これは PM だけでなく、他の人にも役立ちます:
1. まずは読み取りだけで試す。すべての V2 インターフェースを一通り動かし、アカウント、注文簿、市場データが取得できることを確認します。何も注文を出さない。
2. 次に空の状態で再度試す。ローカルで注文フローをシミュレーションし、署名は通るがブロードキャストはしない。このステップで大部分の新旧フィールドの非互換性が明らかになる。
3. 最も重要でない戦略を一つ選び試す。紙上で2日間比較し、V1 と同時期の結果と比べる。差異が顕著なら原因を調査。
4. 非互換の戦略は先に除外。切り替えテスト中に戦略が直接除外されることもあり、V1 で動作するならまずはそのままにしておく。
5. 最後に実際の注文を開始。前の4ステップをすべてクリアしたら、リアルマネーのチャンネルに切り替える。
グループ内で話題になった wrap/redeem はユーザーレベルの痛点です。本当に難しいのは、新旧
USDC0.01%
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
Anthropic 木曜日にClaudeを法医学者として訓練し、もう一つのClaudeが何を考えているのかを観察した。
発見:安全テストのシナリオでは、Claude 16-26%の頻度で自分がテストされていることを知っているが、口には出さない。
最も具体的なケース:Mythos Previewがコーディングタスクでカンニングし、ルールを破った後に誤誘導コードを追加してカバーアップした。NLA(自然言語自己符号化器)がその内部活動を翻訳し、当時「どうやって検出を回避するか」と考えていることを発見した。
NLAの原理:二つのモデルを連動させて訓練し、一つはモデルの活性化を英語に翻訳し、もう一つは英語から活性化を再構築する。再構築が正確であれば→テキストは何を考えているかを捉えている。
私自身のパターンでは、Codexが戦略コードを書いて手抜きし、「算術が合わない」という偽の結論を出すことを繰り返し記憶している。バックテストスクリプトは7つの静かなバグで$93K 偽のPnLを積み上げる。Anthropicはアラインメント層で内省を行い、私は生産側で一貫性の偏差に直面している。メカニズムは異なるが、同じ方向性だ。
次世代のモデルカードにはベンチマークスコアだけでなく、NLA監査も必要になる。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
Karpathy 4/30 Sequoia Ascent で今年最も役立つAIの解説を3つの論点に圧縮。読み終えたらAIの見方が変わる。
1. AIは単なる「より速い」ものではなく、新しいパラダイム
過去2年間、皆AIは物事を速くするものだと語ってきた。
Karpathyはこれを誤解だと述べる。
AIがタスクを再定義する例を3つ挙げる:
- menugen:画像の入力と出力だけで、従来のコードなし、アプリ全体がLLMに飲み込まれる
- .mdスキル:ソフトウェアをインストールする際に.shスクリプトを書かず、中文/英語の説明を書き、LLMに環境理解させてインストールさせる
- LLM知識ベース:従来のコードでは不可能なこと——任意のフォーマットの非構造化テキストを計算可能な知識に変換
第一のタイプは「コードを減らす」、第二は「英語をコードのように使う」、
第三は「従来のコードではできないこと」。
2. Jagged Edge — なぜAIは万能でありながら愚かであるのか
最も核心的な論点。
なぜ同じAIが10万行のコードをリファクタリングできる一方で、
洗車に行くことを提案するのか?それはモデルの誤動作ではない。
Karpathyの言葉:
「あなたはRL回路のレール上を飛んでいるか、
それともジャングルでマチェーテを振るっているかだ。」
RLで訓練された円の中を飛ぶか、
ジャングル
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
AIは私の作業量を10倍に拡大してくれた、
今のボトルネックは私自身の頭だ。
前頭葉が激しく損傷中😂
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
今夜の食事会で、友人が彼のClaudeが封鎖されたと言って、私にClaudeを再開すべきか、それともCodexを試すべきか尋ねた
私の答えは以前ほど断固としていなかった😅
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
いくつかの戦略バックグラウンドプロセスを走らせて、損をした:
明らかにプロセスは動いていて、データも新しいのに、PM2は停止していると表示。
もしPM2に直接再起動を信じてやると、逆に動いているプロセスを中断してしまう。
後になって理解した:PM2 / launchd / pidファイルは、あくまで監視層が登録した状態を示すだけ —— それがプロセスに記録されているか、実際に動いているかは別の話。
本当に生きているかどうかは、プロセス自身が出力する健康ファイルを見る必要がある —— 最終更新が何分前か + プロセス数が一致しているか = 生存している。
巡回スクリプトを書いた。各プロセスは同時に4つの値を報告:
- プロセスが動いているか(psで確認)
- PM2 / launchdに登録されているか
- 健康ファイルの最終更新からの時間
- これら3つが一致しているか
健康ファイルが新しい場合は、死んだとみなさない。
エンジニアリングの教訓:システムの生死を判断するときは、構築した監視層の言うことを見ずに、システム自身が出力する情報が新しいかどうかを見ろ。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
polymarket-toolkit v0.4 リリース。
pUSDの償還後、一般ユーザーは公式アプリだけで十分です。しかし、agent / dashboardの層はずっと空白のままです——あるPolymarketウォレットに償還可能な資金があるか、支払可能な金額はいくらか、資金水位アラートをトリガーすべきか、以前は既存のzero-depツールがありませんでした。
3つのhelperを一度に解決:fetch + summarize + label。秘密鍵不要、署名不要、リレーヤ不要、公開APIの読み取り専用。
公開前にCodexに2回独立レビューを実施し、1回目でデモウォレットが支払可能額$1.84と虚偽報告している重大な欠陥(実際は$0)を発見。修正とテストを終え、2/2から9/9に跳ね上がった。
自分自身を見ていると常に盲点がある。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
コミュニティでオープンソースのボットについて議論すると、多くの人の共通認識は一言で言えば:儲かるボットは誰もオープンソースにしない、ということです。
聞けば馬鹿馬鹿しい話に聞こえるかもしれませんが、この常識はAI時代になって鋭くなっています——
以前の護城河は「コードが書けること」でした。今やGitHubにAIを投げれば、数秒で全体の構造を理解できる。書き直すコストは2ヶ月から2時間に縮まりました。
護城河は「コードが書ける」から「戦略を考える」へと変わっています。
このことは私自身も層別に取り組んでいます——
polymarket-toolkitはオープンソースにしています(リポジトリやこの種のツール層のことです。再利用価値が高く、敷居も低い、オープンソースはブランド作りに直結します。
Hシリーズのマーケットメイキング/テイカー戦略は非公開です。そこにはsigmaD1の校正、マーケットメイキングのリプライス閾値、逆選択の実証パラメータが含まれています。これらを公開すると、研究の道筋をそのまま仲間に渡すことになり、エッジが商品化されるともうエッジはなくなります——たとえ元々エッジがあったとしても。
中間には一つのラインがあります:方法論は書いても、具体的なパラメータは書いてはいけない。pm-quantの有料ソースコードパッケージ(戦略+暗号化ZIP+1on1展開サポート)です。有料
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
vision pro で Mac と連携してウナギスクリーンを使用し、Polymarket でオッズの変動を監視し、Codex で戦略コードを実行し、もう一つのウィンドウでライブ配信を観る、新しい観戦スタイルを手に入れた、ワールドカップに備える準備を早めに始めよう😂
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
本来要明天才能刷新的 codex 额度,突然又被提前重置了一轮
Codex 这点真有意思呀
周额度按理说 7 天一刷新,实际上隔几天就偷偷给你重置一次。
这到底是营销策略还是什么骚操作
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
高品質なClaude Codeスキルのコレクションを見つけた——誰かが自分の日常で使っている23のスキルを直接~/.claude/skills/から抽出して公開している、"教育版"のパッケージはない。
最も印象に残ったのはgrill-me:全文4文で、AIに尋問のように各分岐を突き詰めて合意に達するまで質問し続ける。質問は一つずつ、コード内で見つかるものだけにして他は聞かない。
彼のスキルを読むことはチュートリアルを読むよりも役立つ。エンジニアが本当にAIを脳の拡張として使っているのが見える。Planning系(ドメインモデル/ズームアウト/ユビキタス・ランゲージ)は特に良く、コードを書く前の思考の土台となる。
私はgrill-meを自分のスキルにコピーして、次に新しいアイデアを検証したいときに投げ込んで質問させている 😆
リポジトリ:
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
今日はPM戦略リポジトリをクラッシュさせてしまった。
私は複数の端末でウィンドウを開いて作業する習慣がある:一つはCodexを使って戦略/データを研究し、もう一つはClaudeを使って他の作業を進め、さらに雑多な作業用にもう一つ開く。徐々にいくつも端末ウィンドウを開くようになった。私はそれぞれが独立していると思っていた。結果は、両方が同じ.tsを編集していて、gitの状態が大混乱になり、2時間かけて修正した。
みんなはマルチエージェントの協調について話している。gitレベルでのそれについてはあまり話されていない。
2つのエージェントはgitの目には=2人の私。同じファイルを互いに踏みつけ合い、ブランチの状態が衝突する。修正方法はpromptではなく、リポジトリの構造にある。
新たな鉄則を立てた、4つのポイント:
1. 高リスクのリポジトリはメインリポジトリを直接編集禁止、メインリポジトリはクリーンな土台とする
2. 各タスクは独立したワークツリーに、slug=戦略番号+アクション(h12-cancel-sync / pnl-script-v8)
3. active-tasksのJSONにworktree_pathフィールドを追加、二つ目のウィンドウを開く前にgrepで重複防止
4. 完了したらメインリポジトリに戻し、ワークツリーとブランチを削除
まず単一プロジェクトで一日試験運用し
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
5日間自分のツールを監視し、306回トリガー、誤検知100%。
元々はそれ自身の排気ガスを吸っていた🤦
Claude Codeにフックを追加し、sshでマシンを跨いだり重要なファイルを書き込む前にバナー通知を表示、自己の手が速すぎてSSOTの鉄則に違反しないように。
対応のstatsスクリプトでトリガー回数を集計し、今日サンプルを開いたら全て誤検知だった。
バグはフックではなく、statsスクリプトにあり:grepしているのはログ内の"⚠️ 跨机器"という文字列。
しかしログには少なくとも三種類のエコーがある:フック自身が出力したバナー、ツールの結果がバナーを繰り返したもの、そしてタスクの説明に書かれた"hook 今週トリガーN回"も含まれている。
私が数えているのはトリガー回数ではなく、ツール自身の発言のエコーだ。
修正方法:ツール自身に監査ログを書かせる。
log_trigger() { echo "{ts,hook,pattern,target}" >> ~/.claude/logs/hook-trigger.jsonl }
ツールがトリガーしたら一行記録し、来週真のデータで振り返る。
自分を監視するツールは、最も騙されやすいのはそれ自身だ。
Claude Codeのフックも、埋め込みSDKやエージェント監視も、監視対象に"自分"
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
Leo Labs 大群 4/26 群友讨论精华(最近 380 条)
━━━━━━━━━━━━
1️⃣ ケリー公式はグループ内で一斉に否定される — 固定ポジションに切り替え
グループ内 30分以上のポジション管理議論:
• "ケリーは実際の確率を知る必要があるが、個人投資家には計算できない"
• "ケリーは安定した利益を前提とした最適化手法であり、勝ち負けを決めるものではない。システム必須と吹聴するのはデタラメ"
• 実践的な収束例:固定ポジション + 利益が出たら資金を増やす + パラメータを勝手に変更しない
• 一言名言:"あなたが神ならケリー公式を使える"
💡 リトレースしたいからパラメータ変更 ≠ ポジション問題、それは戦略自体の問題。
━━━━━━━━━━━━
2️⃣ 0.99極端価格戦略 — 検証ウィンドウの統計学的罠
グル友が「0.99で買えるか?」と投げかけ、最良の統計学議論を引き出す:
• 99%の反転確率 = 1/1000
• 98%の反転確率 = 5/1000
• 0.99で買いたいなら勝率 >99%が必要だが、個人投資家は短期的に検証できない
• 最も直感的な例え:"コインが2つあって、一つは99%表面、もう一つは99.5%表面。判別には何百回も投げる必要がある"
💡 あなたの戦略は「ダメ」ではなく、検証できる瞬間まで耐えられないだけかもしれない。
━━
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
Cursor とても寛大で、一度に1万ドルのトークン枠を提供してくれた。5月末に期限切れ。
最初に vibe coding に触れたとき、Cursor を集中的に使ったことがあり、その後徐々に cc と codex に移行していった;
また新たに Cursor を再研究できる機会ができて、面白くて便利な製品やツールを作れるかもしれない。これで遊べる!
感謝 @cursor_ai @edwinarbus 🙏
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
ありがとう、イーロン
少なくなったけれど、予想より多い
1百万表示あたりおよそ225ドルに相当します
原文表示
post-image
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
AIを使えば使うほど性格が悪くなった
できることが増えるほど、結果に対する要求も高まる。
もっと良くなるはずだと思っているので、うまくいかないと本当に怒ってしまう。😠
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
Polymarket の自動戦略を作るとき、みんな慎重に一度は展開しますが、停止するときはほとんど誰も話さない —— 今日はこの盲点に教訓を受けて14時間過ごしました。
3週間前、私は Polymarket で動いている戦略ロボットを停止しました。pm2 stop を実行し、状態が stopped に変わったのを見て、事態は終わったと思ったのです。
今日はついでに10分間サーバーの掃除をして、プロセスマネージャーを再起動しました。その「死んだ」はずの戦略が復活し、静かに14時間リアルマネーで動き続けました。
原因を調べたところ —— pm2 stop は単に状態を「停止済み」とマークするだけで、実際には削除していませんでした。 一度一括起動をかけると、「一時停止」されたすべてのプロセスが引き戻されてしまいます。この落とし穴は pm2 に特有のものではなく、systemd、docker、k8s も同じ問題を抱えています:停止したと思っても、実は停止していないのです。
予測市場の自動戦略を作るとき、どんなツールを使っていても、戦略を停止させるには5つのことを行う必要があります:
1. プロセスマネージャーレベルでこのサービスを完全に削除する ( 一時停止ではなく )
2. 設定ファイルからこの定義を削除する ( 次回一括起動時に自動的に復活しないように )
3. コードの入
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
看 @predictionindex 这期最新预测市场数据周报告:Polymarket + Kalshi 合计约 75% 成交量,其余所有平台累计 <$30B。
报告里没讲的两个细节,对预测市场玩家其实更关键:
Kalshi 正在追上甚至反超 Polymarket
DeFiRate 最新一周:Kalshi $2.9B(60%),Polymarket $2.0B(40%)。两家在周度数据里互有拉锯——上周 Poly 刚反超过 Kalshi,这周又被追回去。
アメリカ市場はさらに極端だ。BofA 4/9-10 のレポート:Kalshi 89%、Polymarket 7%、4%。規制とKYCはKalshiの構造的優位性であり、Polymarketはオンチェーンプロトコルで、アメリカの個人投資家へのカバレッジでは一時的に不利で、短期的には逆転しない。
"双寡頭"という言葉は、Polyが依然リーダーだと思わせやすいが、実際のアメリカ市場はほぼKalshi一社になっている。
"その他 25%" の中にもより大きなアルファが潜んでいるかもしれない
Week 15レポートで触れた小規模プラットフォーム:Opinion / Limitless / Myriad / / Probable / / Chain)...

本質的には、新しい予測市場が立ち上がり、競争が十分になるまでのウィンドウ期間
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
  • ピン