2025年2月21日,海南師范大學DeepSeek-R1(671B)“滿血版” 本地服務重磅上線,成為海南省首家上線滿血版DeepSeek的高校,也是全國首批“滿血版”DeepSeek本地化部署的高校。上線至4月1日,DeepSeek累計回答師生問題11276條。為進一步深度挖掘師生對AI服務的關切點,通過對這些數據的時間、關鍵詞、用戶行為和語言內容等進行分析,以期掌握學生的提問行為模式、關注焦點與個性化需求。
高頻詞分析
高頻詞統計能夠直觀反映師生在提問中關注的主題與領域。本分析對所有文本首先進行分詞處理和詞頻統計,結合matplotlib和wordcloud等可視化工具,繪制關鍵詞的詞表和詞云圖,直觀展示師生在平臺上討論最頻繁的話題。

圖1 師生提問的高頻詞詞云圖
從圖1高頻詞分布來看,師生最常提及的詞語為“研究”,出現頻率高達3603次,表明科研與項目類問題在整個平臺中占據核心地位。其次,“文化”和“發展”分別出現2426次和1708次,也具有較高熱度,說明師生對社會文化、非遺傳承等主題有著較高的關注度。“海南”一詞頻次達到1624次,體現出地域屬性在師生提問中的廣泛滲透。除此之外,“教學”“教育”“設計”“理論”、“技術”“中國”“內容”“學習”“社會”等高頻詞,也反映出師生主要聚焦于學術研究、專業發展、課程教學等方面,具有明顯的學習導向和專業導向特征。
詞云圖進一步強化了上述觀察。詞云圖通過詞頻可視化,將高頻關鍵詞以字體大小和色彩分布的形式展現出來。圖中“研究”“教學”“發展”“師生”“海南”“教育”等詞匯字體明顯突出,再次驗證其在整體數據中的高出現頻率。圖中還出現了如“非遺”“旅游”“對話”“分析”“方法”“項目”“模型”“中國”等具有本地要素或專業術語色彩的詞匯,說明師生關心本地區域文化、知識學習和科研研究等內容。
對關鍵詞頻率分析不僅揭示了師生在使用平臺過程中的主要關注點,還表明他們的提問呈現出多元化、實踐化、地域化的特征。相關教育部門與教學管理人員可據此進一步優化內容資源推薦、提升答疑系統精準度,推動學術服務的智能化與個性化水平。
關鍵詞趨勢分析
詞表詞頻反映了師生當前的關切點。為了直觀感受師生關注的趨勢變化,進一步將時間戳與內容數據進行關聯。通過關鍵詞匹配,提取師生關切的“教育”“研究”“發展”“文化”“海南”等關鍵詞,按天統計各關鍵詞的提及次數,并使用pandas和matplotlib工具完成折線圖的繪制。圖2展示了師生提問的高頻關鍵詞在每日變化趨勢。可以看出,“教育”與“研究”這兩個關鍵詞,在整個時間段內始終處于較高關注度,表明師生在這一階段對學術發展、教育資源或研究方向存在集中提問或討論需求。而“論文”一詞的波動較為平穩,但在3月上旬有一次明顯增長,可能與臨近某個科研活動或者論文提交等研究計劃相關。

圖2 關鍵詞的時間變化趨勢
同時,“文化”和“交流”這兩個關鍵詞雖然整體提及頻率不如“教育”與“研究”高,但其曲線走勢相對穩定,說明在師生的學習過程中,文化背景和交流互動是一個持續關注的話題。
綜合來看,關鍵詞的時間變化體現出師生關注趨勢,其中“教育”“研究”“論文”等是關注核心,而“文化”“交流”則表現出更具人文或交往屬性的精神維度。
提問時間分布
師生提問的時間分布研究,一方面可以根據時間適當調整算力分配策略,另一方面可以更有針對性地及時回復師生關切問題。以小時為單位進行分析,從表1可以看出,師生在10點至23點之間較為活躍,尤其是15點至17點期間提問量達到高峰。這反映出師生的提問時間與課余時間安排密切相關,晚間提問頻次的增加也說明部分學術討論學習可能集中在非上課時間。
表1 師生提問時間分布表

關鍵詞共現分析
師生關切的關鍵詞明顯呈多元化,其中本地文化是師生持續的關注點之一。以“海南”為中心詞,使用networkx構建了一個高頻共現詞的網絡關系圖,用于揭示師生關注“海南”時關聯的核心話題。網絡關系圖以關鍵詞作為中心節點,將共現詞作為連接節點邊的粗細表示共現頻率,邊權越大,表示共現越頻繁。
在“海南”這一核心關鍵詞的共現網絡圖中,可以明顯看出它與多個語義關聯緊密的關鍵詞構成了豐富的主題網絡。較為突出的共現詞包括“文化”“建設”“旅游”“教育”“研究”“自貿港”“師大”“熱帶雨林”等,顯示出用戶對“海南”在文化傳承、生態資源、教育發展及政策戰略等方面表現出高度關注。
例如,“自貿港”體現了師生對國家戰略背景下海南發展的敏感性,社會熱點及區域發展等。而“文創”“熱帶雨林”“傳統” 等詞,則突出了本地自然與文化資源的重要位置。
值得注意的是,一些更具地方特色的關鍵詞如“老爸”“長臂猿”也出現在網絡圖中。其中“老爸”應理解為“老爸茶”文化的簡稱,這是海南極具代表性的地域性生活方式和文化符號。此外,“背景”“生態”“學院”“生活”等詞語,進一步揭示了師生們提問內容的多元性和地方性。
通用性與個性化問題分析
通用性問題
通用性問題則是指重復頻率較高、內容通用的問題。詢問8次以上的通用性問題分布見表2。師生提問主要是向Deepseek求助,其中接入性問候居多,體現了人與機器之間沒有強烈的距離感,體現了智能機器的人性化和廣大師生的普遍接納心理。第二類問題是希望對deepseek進一步了解,反映了廣大師生們對AI應用的進一步深入探索。第三類問題是希望增進對校園的了解, 表明師生的母校感情和關心。
表2 詢問8次以上的通用問題列表

個性化問題
為更深入了解師生提問的關注點,采用LDA(Latent Dirichlet Allocation)主題建模方法,對師生提出的個性化問題文本進行無監督主題識別。LDA模型能夠從大規模文本中學習出“詞—主題”和“主題—文檔”之間的潛在概率關系,從而提取出每個主題所代表的核心關鍵詞,進而幫助學校進一步理解師生關心的主要話題。通過分析師生提出的所有問題文本,自動聚類出了三個主要話題。每個主題由一組高概率的關鍵詞構成,反映出師生提問內容的核心語義特征。
教育發展類主題。關鍵詞如“傳統、社會、技術、理論、教育、研究、發展、海南、文化”等,體現了師生對教育政策、社會進步與區域發展的關注,整體問題內容具有師范類大學的宏觀視角。
社會文化類主題。關鍵詞包括“報道、文化、新聞、南海、文創、孩子、父母、海洋、研究”等,涵蓋社會現實、家庭關系與地方文化,說明師生普遍關注社會熱點與文化傳播相關議題。
學習科研類主題。高頻詞匯如“論文、內容、教師、對話、師生、學習、教學、分析”等,聚焦學術寫作、課堂交流與學習過程,反映了師生在學習與科研實踐中的具體需求。
從LDA主題建模結果來看,“教育發展類”問題數量最多,占總問題數的55.2%,關鍵詞集中在“學習”“教學”“論文”“教師”等,這表明師生在平臺上的提問多數聚焦于課程內容理解、學術規范探討與論文寫作相關內容,體現出平臺在輔助教學和學術交流方面的重要作用,也凸顯了師生對學術提升和專業能力訓練的高度重視。
“社會文化類”與“學習科研類”問題分別占比28.5%和16.4%。前者主要涉及社會熱點、文化傳播與個人經驗等主題,顯示師生對于公共話題具有一定的關注和表達欲望。后者則更偏向具體論文分析和對學習方法的關注,可能反映出師生在學習路徑中對案例分析與教學實踐的探索需求。
問題回答分析
情感分析
為更客觀了解AI助手的回答質量,對Deepseek回答的文本進行情緒分析,從而間接分析用戶對AI的滿意度。采用基于RoBERTa架構的中文預訓練模型,通過構建文本數據集并使用批量推理方式,獲取AI助手每條回答的正向情緒得分,得分越接近1代表情緒越積極,結合Seaborn進行分布可視化,反映AI回應的整體情緒傾向。

圖3 Deepseek回答的情感分布
從圖3中可以看出,AI助手生成的回答整體情緒傾向積極,情緒得分集中分布在0.85至1.0區間,尤其在0.9以上頻次最高。這說明AI助手在回應用戶問題時,整體語氣積極、語態正面,有助于提升用戶的接受度與滿意度。說明系統在絕大多數情境下能夠保持情緒穩定與表達友好,負面表達或偏冷情緒非常少,符合教育服務類AI系統的人機溝通需求。
高頻詞與語言風格
AI回答本身并沒有情感傾向,更多是用戶對AI回答的感官體驗。因此,挖掘AI的語言表達方式也具有積極的現實意義。繼續利用WordCloud詞云庫生成可視化圖像,將關鍵詞出現頻率映射為字體大小,輔助理解系統回答中關注的核心詞匯與語言風格。

圖4 Deepseek回答高頻詞(去停用詞)詞云
從圖4詞云圖可以看出,系統回答中出現頻率較高的關鍵詞包括“需要”“可能”“用戶”“希望”“提供”“通達”等,這些詞匯反映出AI助手在回應用戶問題時,傾向使用委婉、推測性和服務導向的語言風格。例如,“需要”“希望”體現出對用戶需求的重視,而“可能”“或者”則體現出謹慎表達和靈活判斷。這種語言風格既具備服務意識,也符合教育場景中語言表達的溫和、鼓勵性特點,有助于增強用戶的接受度與信任感。
回答長度統計
對AI每條回答的詞數(Token數量)進行統計,可以反映模型在內容生成時是否具備長文理解與生成能力,從而判斷其回答是否滿足不同復雜度問題的需求。
大部分AI助手的回答集中在500詞以內,說明AI助手在處理日常問答時傾向于簡潔、直接地給出回應。同時也存在部分回答超過1000詞,甚至延伸至3000詞以上,反映出系統在面對復雜問題時具備較強的信息組織和擴展能力。整體上,回答長度呈右偏分布,說明模型能根據問題復雜程度動態調整生成長度,具有良好的應答適配性。
結構性分析
結構性分析采用基于規則的文本特征識別方法,判斷每條回答是否存在段落結構(如換行符、分點表達)與總結性語言(如“綜上所述”“因此可見”等)。統計具備這兩項特征的回答比例。分析表明,大約78%的回答具備段落結構,說明AI助手在多數回復中能較好地使用換行和層次組織內容,增強了文本的可讀性。然而,僅有約43%的回答包含總結性語句,表明系統在提供全面內容時仍有提升空間,尤其在回答結尾處形成邏輯閉環的能力上尚不穩定,也可能較簡易的問題就不需要累贅做總結。
從上述分析可以看出,師生使用平臺提問活躍度較高,尤其關注海南相關話題、學術研究、師生、教育等具體內容,體現出學業發展與區域特色相結合的關切點。此外,通用性問題占比較小,平臺對個性化需求的支持顯得尤為重要。另外,AI助手的回答在情感表達、語言組織、長度控制等方面表現出較高水準,能夠提供良好的用戶交互體驗。積極情緒占比顯著,回答內容以問題解決為導向,整體具備邏輯清晰、實用性強的特點。但也存在如總結語句不足、個別情緒偏弱等可優化空間。建議未來結合用戶提問意圖,進行分場景的內容結構調整,引入總結模板與人性化表達機制,以進一步提升平臺問答質量與服務精準度。
海南省高等學校教育教學改革研究項目(Hnjg2024ZD-19),海南省自然科學基金項目(625MS081),產學合作協同育人項目(CX2014141)
來源:《中國教育網絡》2025年4月刊
作者:曹均闊1 吳宇欣1 汪上晉進1 陳國蓮2(作者單位1為海南師范大學信息科學技術學院;2為海南師范大學國有資產管理處)
責編:陳榮