ब्लॉग / साक्ष्य नोट्स

लेख

साक्ष्य डैशबोर्ड audit trail है; ये लेख बताते हैं कि उससे फ़ैसले कैसे निकलते हैं। हर निबंध एक सवाल से शुरू होता है, उसे समझाने वाले chart का नाम बताता है, और आखिर में operator के लिए साफ़ सीख देता है। इन्हें क्रम से पढ़ें, या सीधे उसी layer पर जाएँ जिसकी आपको ज़रूरत है।

यह क्रम दावे से practical इस्तेमाल तक जाता है। अवलोकन निबंध मुख्य बात और साक्ष्य की सीमा तय करता है। साक्ष्य विषय मापे गए हर हिस्से को एक-एक करके खोलते हैं। सेतु निबंध दिखाता है कि कहाँ भाषा measurement से production की तरफ़ मुड़ती है। परिचालन निबंध recovery, cache routing, retention, और migration sizing जैसे रोज़मर्रा के कामों में measurement की यही आदत ले जाते हैं। इनके नीचे साक्ष्य डैशबोर्ड में वे governed tables और source charts हैं, जिन पर हर दावा टिका है।

अवलोकन निबंध: वही token price, अलग bill

public chart-data snapshot को साथ लेकर पढ़ने वाला मार्गदर्शक: कहाँ reasoning effort सिर्फ़ खर्च बढ़ाता है, कहाँ उसे आज़माना बनता है, और hidden reasoning tokens को budget में साफ़-साफ़ क्यों गिनना चाहिए।

अवलोकन निबंध पढ़ें

अवलोकन निबंध के भीतर के विषय

छोटा तथ्य-आधारित काम

cost बढ़ती है, लेकिन quality में उसके बराबर सुधार नहीं मिलता।

यह विषय पढ़ें

अदृश्य रीज़निंग टोकन

output लगभग वैसा ही दिखे, तब भी bill क्यों बदलता है, यह internal tokens समझाते हैं।

यह विषय पढ़ें

कई चरणों वाला काम

जब evaluator में काफ़ी बदलाव दिखे, तब reasoning effort वाजिब ठहर सकता है।

यह विषय पढ़ें

टूल-एजेंट ceiling जाँच

agent workloads में quality और latency को साथ देखकर समझना पड़ता है।

यह विषय पढ़ें

Agentic loop & budget governance

नया measurement नहीं, बल्कि operator pattern (L6): उस loop को बाँधें जहाँ ceiling जाँच नहीं पहुँचती।

यह विषय पढ़ें

PTU/PAYG योजना

modeled crossover सीधे capacity का साक्ष्य नहीं, बल्कि planning के लिए मार्गदर्शन है।

यह विषय पढ़ें

साक्ष्य डैशबोर्ड

इन लेखों के पीछे की governed tables और rendered source charts देखें।

साक्ष्य डैशबोर्ड खोलें

सेतु निबंध

एक निबंध साक्ष्य और परिचालन के बीच की कड़ी है। वही बताता है कि भाषा क्यों बदलती है और कौन-सी आदतें आगे भी साथ रहती हैं।

measurement से production तक

साक्ष्य स्तर पर measurement की जो आदत बनती है, वह production operations तक कैसे पहुँचती है, और क्या-क्या वैसा ही रहता है।

सेतु निबंध पढ़ें

परिचालन निबंध

ये निबंध production operations के एक स्तर और करीब जाते हैं: recovery, cache routing, retention, और migration sizing।

`retry-after-ms` के साथ 429 रिकवरी

PTU recovery में health-check polling के बजाय service header का सहारा क्यों लेना चाहिए।

यह लेख पढ़ें

`prompt_cache_key` बकेटिंग

cache keys routing-affinity control हैं; bucket request ID से नहीं, workload के हिसाब से बनाइए।

यह लेख पढ़ें

स्पष्ट cache retention

जब operation लंबे cache window पर निर्भर हो, तब retention को request policy में साफ़-साफ़ लिखना चाहिए।

यह लेख पढ़ें

reasoning-model migration sizing

output weighting, reasoning tokens, cache shape, और max-token policy के ज़रिए PTU demand को समझाइए।

यह लेख पढ़ें

लेख

अवलोकन निबंध: वही token price, अलग bill

अवलोकन निबंध के भीतर के विषय

छोटा तथ्य-आधारित काम

अदृश्य रीज़निंग टोकन

कई चरणों वाला काम

टूल-एजेंट ceiling जाँच

Agentic loop & budget governance

PTU/PAYG योजना

साक्ष्य डैशबोर्ड

सेतु निबंध

measurement से production तक

परिचालन निबंध

retry-after-ms के साथ 429 रिकवरी

prompt_cache_key बकेटिंग

स्पष्ट cache retention

reasoning-model migration sizing

`retry-after-ms` के साथ 429 रिकवरी

`prompt_cache_key` बकेटिंग