界面新聞記者 | 肖芳
界面新聞編輯 | 文姝琪
繼上線高考志愿大模型之后,夸克AI搜索又接入了自研的健康大模型。
夸克健康大模型是以通義千問為基礎訓練出來的垂類模型。夸克健康算法負責人徐健對界面新聞表示,在訓練過程中,技術團隊不只是訓練AI做簡單的醫學問答,而是希望AI學會整體的診療思維。
徐健表示,健康大模型背后的技術策略包括三個方面,第一是構建優質的大規模數據,這是模型知識性的底層;第二是正確性對齊及循證的技術,可以系統解決好正確性方面的問題;第三是醫療慢思考推理能力的建設,通過它解決復雜問題。
在垂類模型與通用模型對比中,夸克健康大模型呈現出在復雜問題中表現更好于通用模型的趨勢。其中,在主任醫師級別的性能測試中,夸克健康大模型回答的正確率為67.7%,DeepSeek-R1和GPT-o3-mini的正確率分別為38.7%和35.5%,而在初級醫師級別測試中,夸克健康大模型和DeepSeek-R1的正確率均超過80%,GPT-o3-mini的正確率也超過了70%。
徐健告訴界面新聞,夸克健康大模型在性能測試中能夠更好地回答復雜問題,并不是一口氣就做好的,而是經歷了一個長期迭代。這個過程中,研發團隊主要在數據分類和評估、語料探查技術和時效性更新技術三方面的投入,提升數據建設能力。
由于醫療的問題的嚴肅性,夸克在健康大模型還對用戶問題進行產品上的分層處理,對偏嚴肅醫療方面的問題進行明確界定。“在產品上線前,我們針對回答效果進行了評價,在滿意度、準確度達到90%以上才會上線。”夸克健康運營負責人趙存忠對界面新聞表示。
接連推出高考志愿大模型和健康大模型,夸克AI業務的發展意圖不再局限于搜索,而是通過優質內容吸引新用戶并獲得更好的用戶留存。夸克健康產品負責人姚垚向界面新聞透露,夸克每月有2000多萬的用戶會問健康問題,是非常大的比例。
趙存忠對界面新聞表示,夸克健康服務目前不考核商業化指標,考核的核心是對用戶需求回應的滿意度,包括用戶的滿意度指標、用戶留存指標等多個維度。“如果真正解決了用戶的需求,用戶留存肯定是有增長的,過了半個月或者一個月遇到新的健康問題,肯定還會來搜索。”
在今年高考報志愿期間,夸克推出高考服務。官方公布的數據顯示,夸克高考服務4000萬用戶,生成超1200萬份“志愿報告”。但高考服務的目標用戶以及使用的周期都比較有限,相比之下,健康服務能夠服務的用戶規模和頻次都更高。
在阿里AI的新戰略下,夸克承載了“AI to C”的部分,也承擔了更大的用戶增長壓力。但在當下的市場格局下,搜索引擎不僅面臨著抖音、小紅書等內容社區的挑戰,也面臨著各類AI助手的分流。
夸克打出了AI搜索的牌,還需要提供更多差異化的能力,垂直模型和Agent服務是夸克重點的差異化探索方向。
徐健告訴界面新聞,學習和醫療是夸克的兩個重要戰略賽道,夸克通過垂直模型提供服務。在其他領域,目前夸克主要通過通用大模型來回答這些問題。“從技術原理角度來看,做垂類模型還是希望基于非常好的通用模型,不可能只會醫療別的不會。”
從目前的用戶增長來看,夸克的差異化競爭路線獲得了一定的成效。AI產品榜的數據顯示,今年6月,夸克以1.56億月活用戶超過豆包、DeepSeek等應用,成為國內總榜的第一名,月活用戶環比上月增長2.51%。
從長期來看,夸克仍需要穩定的服務能力讓自身保持持續的競爭力。
發表評論