一個是數據庫DevOps場景,另一個是數據洞察場景,前者是為了用AI治理好數據庫,后者是為了用好數據。
文|游勇
編|周路平
數據庫作為IT基礎設施的一部分,無論是資源的利用效率,還是對風險告警的管控,都關系到企業業務能否正常高效運行。因此數據庫的治理一直是業內所關注的話題。
9月17日,在2025騰訊全球數字生態大會上,騰訊云數據庫團隊正式推出數據庫AI服務(TencentDB AI Service,簡稱TDAI),引入智能體能力,探索AI與數據庫的結合。
騰訊云希望從數據庫DevOps與數據洞察兩大核心場景入手,用AI幫助企業治理好數據庫以及用好數據。
01
SQL風險預警,不再“事后滅火”
在DBA(數據庫管理員)的日常工作中,對數據庫事前的風險治理,需求旺盛,但沒有被很好的解決。
“2024年到2025年,每個月我們都看到有客戶由于SQL使用不好,導致了SQL的事前風險出現問題。”騰訊云數據庫副總經理羅云告訴數智前線。
比如,曾有頭部企業遭遇過一場驚險的事故。一位工程師在日常優化時,隨手添加了一條看似普通的SQL清理語句。這條本該在非業務高峰默默執行的SQL,卻在系統高負載時啟動,逐行掃描整個數據庫,這個風險SQL不僅持續吞噬著數據庫實例的資源,甚至導致部分交易系統被迫中斷。
這是業界一起典型的“事后滅火”的數據庫治理案例。以往,都是業務SQL打標、現網SQL事后審計等方式被動應對,但始終無法破解風險SQL”先上線,再發現”的死循環,陷入低效治理的惡性循環。
背后面臨一個行業的深層次難題,在現行的數據庫管理體系中,開發者與DBA的視角不同,開發者聚焦業務邏輯但缺乏SQL風險感知能力,DBA深諳SQL優化卻難以介入開發階段,兩者認知的鴻溝是風險SQL治理的癥結所在。當風險SQL最終引發故障時,DBA往往只能被動響應,卻難以追溯代碼層面的問題源頭。
而既懂數據庫,又懂代碼的AI能填補DBA與研發之間的鴻溝,“AI就像是膠水,粘合了人類組織分工導致的業務和認知上的鴻溝。”羅云說。
騰訊云數據庫團隊針對數據庫運維場景引入了三個智能體,都是目前行業痛點最顯著、同時也是較為容易入手的場景。
一是SQL事前風險預測智能體。AI可以看到SQL背后的代碼長什么樣,不再是一個黑盒,可以提前識別風險,比如SQL在上線前,智能體可以明確告知,哪一行代碼會引入風險,甚至阻止代碼被系統提交,“就像看病一樣,治未病是最好的”。
二是DDL變更風險評估智能體。通過預檢、仿真與預測全鏈路管控風險,預測SQL性能演變趨勢,有效預防“修復即故障”的運維陷阱,最終輸出詳盡風險評估,在低成本試錯中確保變更安全可控。
三是高負載止損值守智能體。AI當前并不能100%把風險扼殺在苗頭,而該智能體可以24小時實時盯著數據庫的資源負載情況,發現險情直接給DBA發告警,并且告訴DBA怎么樣可以恢復,但最終由DBA來決策,減少處理故障應急的時間,“目前我們傾向于把它做成半自動的。”
騰訊云數據庫通過上述三個智能體構建了覆蓋“開發-測試-上線-值守”的一站式風險SQL防控體系。而羅云透露,目前這三個智能體都能做到95%以上的準確率。而且因為是在預警層面,最終決策由人來做,可以有效避免大模型的幻覺問題。
不過,羅云告訴數智前線,這些智能體目前重點還是在騰訊內部場景打磨,先把產品做扎實,下半年或者明年初會正式向市場推廣。
而未來,騰訊云會有更多Agent與數據庫的結合實踐,比如售前咨詢、性能分析以及診斷分析智能體,“可能未來會有更多分職責的小智能體”。
但每個場景都有對應的Agent,如何讓這些Agent自動調用和協同工作也是未來需要解決的難題。羅云看來,未來這些Agent前面會有一個具備意圖識別能力的主Agent。用戶提通用問題,會先由主智能體判斷交給哪些小的智能體來執行。
02
數據洞察,無需靠人工問數
相比于DevOps的智能體在運維層面,幫助企業用AI治理好數據庫,數據洞察的智能體,則是解決數據的價值如何被挖掘的問題。
以前,企業需要數據,以人工問數為主,比如老板提了一個需求,數據分析師寫SQL,然后把結果給到老板。
這顯然是一個非常被動且低效的方式。
一是認知片面,人的經驗面臨著分析視角的局限性,難以覆蓋數據中潛在的交叉關聯與隱性規律;
二是感知遲鈍,海量數據動態變化產生的微弱信號極易被人腦的計算瓶頸與注意力分散所淹沒,錯失業務異常的黃金響應窗口;
三是響應滯后,從數據變化到人工介入的分析鏈路存在不可控時延,強依賴于分析者是否能及時發現數據變化,導致洞察價值隨時間衰減。
而智能體則將數據洞察的過程變成了動態感知和主動決策,不再被動等待指令。比如每臺機器的資源規劃是否合理,是否需要采購新的資源,原有機器是否面臨汰換等,這些數據,即便老板不問,也可以通過智能體推送數據洞察的結論,持續看到趨勢變化。
之前,業界普遍的做法是NL2SQL,讓老板用自然語言與智能體對話,實時反饋結果。在羅云看來,騰訊云數據庫的做法會更進一步,會通過智能體持續捕捉數據和表的結構變化,推測不同字段背后可能會導致哪些風險,從而主動規避。
03
為何要自建智能體基礎設施?
在打造這些智能體背后,騰訊云數據庫團隊也自建了智能體基礎設施,包含了自研的數據庫大模型、全域上下文、工具集。
之所以要自建基礎設施,一個很關鍵的因素是,當前業界智能體相關基礎設施無法滿足TDAI智能體服務(TDAI Agent Service)的核心訴求。
2025年初,騰訊云數據庫團隊開始啟動了Agent項目,起初嘗試過用開源模型調prompt,兩三個月發現行不通,專業性不夠,性價比也不高,“有點高攀不起”。
羅云發現,數據庫有大量的領域知識,要打造智能體的大腦,靠當前的通用大語言模型行不通,存在大量幻覺,難以滿足復雜業務場景的需求。
最終,騰訊云數據庫選擇自研了垂類大語言模型,很快,騰訊云數據庫團隊轉向做垂類大語言模型,通過SFT和強化學習,實現了當前的效果。
另外,當前業界智能體記憶系統側重記錄用戶偏好和對話上下文,未與企業私域數據深度打通,或者難以關聯數據庫血緣關系或業務元數據,在企業級智能體應用場景中價值有限。
而騰訊云數據庫團隊搭建的全域上下文(Context)系統,能夠整合Memory(長短期記憶)、Catalog(元數據推理)、DeepSearch(深度檢索),構建企業級數據中樞,實現企業數據與智能體記憶的深度融合。
不難發現,騰訊云數據庫團隊通過對底層基礎設施的重構,確保了智能體能夠契合數據庫治理和數據洞察的需要。
另外一層考慮是,通過做智能體,騰訊云數據庫孵化了多個數據庫垂類大語言模型,以及Agent contents、 智能體工具集等一套組件,在騰訊云的規劃里,未來可以通過API的方式將基礎設施開放出來?,讓開發者搭建自己的智能體。



