近年來,網(wǎng)絡(luò)安全事件頻發(fā),不少國內(nèi)外高校、企業(yè)遭到攻擊,大量敏感信息泄露。網(wǎng)絡(luò)安全教育作為一項預(yù)防性措施,能很大程度上減少網(wǎng)絡(luò)安全事件發(fā)生,而在作為重要的人才培養(yǎng)基地的高校中,培養(yǎng)和提高網(wǎng)絡(luò)安全意識和技能,有助于學生的健康發(fā)展。
由于環(huán)境的變化和學生的個性化需求,高校傳統(tǒng)的網(wǎng)絡(luò)安全教育理念和方式存在局限性。大數(shù)據(jù)時代,用戶畫像技術(shù)是重要的數(shù)據(jù)分析工具,通過數(shù)據(jù)采集、處理、提取、構(gòu)建等操作,實現(xiàn)數(shù)據(jù)隱藏價值挖掘,為用戶提供針對性的服務(wù)。在高校網(wǎng)絡(luò)安全教育中應(yīng)用用戶畫像技術(shù),能夠挖掘出用戶的需求內(nèi)容,實現(xiàn)資源服務(wù)的精準匹配和推送,提高用戶信息化素養(yǎng)和網(wǎng)絡(luò)安全意識,不斷完善高校網(wǎng)絡(luò)安全教育內(nèi)容。
在中國知網(wǎng)搜索“用戶畫像、高校”主題關(guān)鍵詞,檢索出有關(guān)高校領(lǐng)域用戶畫像的研究文獻279篇;搜索“大數(shù)據(jù)、高校網(wǎng)絡(luò)安全”主題關(guān)鍵詞,檢索出有關(guān)高校領(lǐng)域網(wǎng)絡(luò)安全的研究文獻87篇。通過分析和研究已有論文,可以發(fā)現(xiàn)國內(nèi)高校關(guān)于網(wǎng)絡(luò)安全教育的畫像研究起步較晚,最早報道是2016年,且大部分論文主要研究用戶畫像在高校圖書館、思政教育方面的應(yīng)用,較少涉及網(wǎng)絡(luò)安全教育方面。
鑒于此,本文借鑒國內(nèi)外專家對用戶畫像在高校教育方面的應(yīng)用研究,提出基于用戶畫像的高校學生網(wǎng)絡(luò)安全素質(zhì)提升模型,研究大數(shù)據(jù)畫像在高校網(wǎng)絡(luò)安全教育的應(yīng)用。
用戶畫像概念和構(gòu)建流程
用戶畫像最早由“交互設(shè)計之父”阿蘭·庫珀(Alan
Cooper)在1998年提出,它是通過分析數(shù)據(jù)建立的用戶模型,是分析用戶真實需求、開展后續(xù)服務(wù)的有效工具。用戶畫像是大數(shù)據(jù)的產(chǎn)物,用于分析用戶的社會屬性、興趣愛好、行為特征等,進而得出用戶的真實喜好、行為等;還可以動態(tài)收集、分析用戶的變化行為,實時、精準描述和預(yù)測用戶需求。庫珀將用戶畫像應(yīng)用于計算機領(lǐng)域,用于分析用戶需求,改善產(chǎn)品性能。之后其他學者也對用戶畫像理論和實踐內(nèi)容進行了豐富。
用戶畫像最早采用統(tǒng)計學的方式對用戶進行描述。隨著大數(shù)據(jù)的發(fā)展,可以通過采集各個系統(tǒng)、平臺上的數(shù)據(jù)預(yù)測用戶的需求,以可視化方式展現(xiàn)用戶畫像。用戶畫像構(gòu)建流程有4個步驟,即數(shù)據(jù)采集、數(shù)據(jù)處理、標簽提取、構(gòu)建用戶畫像。
數(shù)據(jù)采集是用戶畫像構(gòu)建的基礎(chǔ),直接影響用戶畫像的真實性和完整性。為了得到精準的用戶畫像,需要提供的用戶數(shù)據(jù)多樣、準確、全面。構(gòu)建的用戶畫像不同,采集的側(cè)重點也不一樣。數(shù)據(jù)處理是構(gòu)建用戶畫像的重要環(huán)節(jié),目的在于挖掘數(shù)據(jù)的隱藏價值。完成用戶數(shù)據(jù)采集后,需要對其進行分類,并采取一定的數(shù)據(jù)處理方式提取用戶特征。數(shù)據(jù)處理過程包括整理、清洗、過濾、挖掘等,其中,數(shù)據(jù)挖掘是重點工作,常用算法包括聚類算法、關(guān)聯(lián)算法、分類算法、神經(jīng)網(wǎng)絡(luò)等。標簽提取是對數(shù)據(jù)進行整理、聚類、關(guān)聯(lián)分析、文本分析等操作后,從中提取特征值和關(guān)鍵信息,從而形成標簽,得到多維度的用戶描述。構(gòu)建用戶畫像往往就是用戶信息的標簽化過程,利用大數(shù)據(jù)技術(shù)分析用戶行為、偏好等,做到精準分析和預(yù)測,為后續(xù)開展個性化和精準服務(wù)提供重要的數(shù)據(jù)支持。
基于用戶畫像的高校學生網(wǎng)絡(luò)安全素養(yǎng)提升模型
隨著高校對學生網(wǎng)絡(luò)安全素養(yǎng)的要求不斷提高,高校應(yīng)該以學生為中心,通過分析和挖掘?qū)W生畫像數(shù)據(jù),利用各類算法模型進行匹配關(guān)聯(lián),構(gòu)建學生網(wǎng)絡(luò)安全素養(yǎng)提升模型,如圖1所示。模型分為4個步驟,通過采集學生數(shù)據(jù),經(jīng)過數(shù)據(jù)標簽化過程,完成用戶畫像構(gòu)建,然后運用合適的模型算法,向用戶提供智能化服務(wù)。
數(shù)據(jù)采集
高校網(wǎng)絡(luò)安全教育的主體是學生,根據(jù)學生的用戶屬性和行為方式,將用戶數(shù)據(jù)分為3個方面:基礎(chǔ)數(shù)據(jù)、學習數(shù)據(jù)、行為數(shù)據(jù),如表1所示。采集的數(shù)據(jù)越詳細,用戶畫像越清晰,后期數(shù)據(jù)分析越準確。
基礎(chǔ)數(shù)據(jù)主要是對學生個人信息的描述,如姓名、性別、年齡、專業(yè)、生源等,這些數(shù)據(jù)主要來源于學工系統(tǒng),同時也可以根據(jù)實際情況增加需要的項目。
學習數(shù)據(jù)主要描述學生在學習過程中的行為和偏好,主要包括學生參加的網(wǎng)絡(luò)安全方面的課程、實踐課程、工作坊、講座、知識競賽、圖書借閱等。學習數(shù)據(jù)主要來源于教務(wù)系統(tǒng)、工作坊系統(tǒng)、學生社區(qū)活動系統(tǒng)、圖書館系統(tǒng)等。
行為數(shù)據(jù)主要包括學生的安全上網(wǎng)行為數(shù)據(jù)、門禁出入數(shù)據(jù)、消費數(shù)據(jù)等。安全上網(wǎng)行為數(shù)據(jù)用于描述學生的上網(wǎng)習慣和特征,重點記錄學生學習網(wǎng)絡(luò)安全方面的行為數(shù)據(jù),包括瀏覽、下載、搜索相關(guān)內(nèi)容、文獻、書籍等,以及不良的上網(wǎng)行為數(shù)據(jù),包括訪問黃賭毒等不良網(wǎng)站、刷單行為、挖礦行為、點擊釣魚郵件、泄露個人信息行為等。數(shù)據(jù)可以通過學校網(wǎng)絡(luò)安全設(shè)備、上網(wǎng)行為管理設(shè)備等安全監(jiān)管設(shè)備搜集。門禁出入數(shù)據(jù)用于描述學生進出學校、寢室的時間、地點等行為軌跡,數(shù)據(jù)主要來源于門禁系統(tǒng)。消費數(shù)據(jù)主要是校園卡消費流水數(shù)據(jù),數(shù)據(jù)來源于校園一卡通系統(tǒng)。
數(shù)據(jù)標簽化和用戶畫像構(gòu)建
數(shù)據(jù)標簽化是指用戶信息的標簽化過程,即將用戶特征信息映射到標簽體系中,包括數(shù)據(jù)處理和用戶標簽提取,不同的標簽?zāi)苊枋鲇脩舻牟煌暯恰S脩舢嬒駱?gòu)建則是數(shù)據(jù)標簽化后的產(chǎn)物,是將數(shù)據(jù)信息處理、挖掘、標簽化后,構(gòu)建多維度、全方位的用戶畫像。
數(shù)據(jù)處理過程中,因為數(shù)據(jù)來源復(fù)雜,來自各個業(yè)務(wù)系統(tǒng)、數(shù)據(jù)平臺等,數(shù)據(jù)類型多樣,有非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),所以處理起來比較困難。其中,本文用戶的基礎(chǔ)數(shù)據(jù)屬于結(jié)構(gòu)化數(shù)據(jù),學習數(shù)據(jù)、行為數(shù)據(jù)中大部分屬于非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。
本文從三個維度對學生建立標簽體系,分別是學生的基礎(chǔ)屬性標簽、學習屬性標簽、行為屬性標簽,如表2所示。基礎(chǔ)屬性標簽是對學生個人信息的描述,標簽有姓名、性別、專業(yè)等。學習屬性標簽源于學生所學課程、參加的活動等,反映學生的學習過程及偏好,標簽有網(wǎng)絡(luò)安全相關(guān)課程學習時長、課程體系學習程度、參加相關(guān)活動次數(shù)、相關(guān)知識競賽得分情況、相關(guān)圖書借閱次數(shù)、文獻下載數(shù)量等。行為屬性標簽來源于學生瀏覽網(wǎng)頁內(nèi)容、門禁出入、消費等,反映學生上網(wǎng)行為習慣、活動情況、消費情況等,標簽有瀏覽網(wǎng)絡(luò)安全相關(guān)內(nèi)容時長、檢索關(guān)鍵詞數(shù)量、下載資料數(shù)量、門禁出入異常記錄數(shù)據(jù)、消費流水數(shù)據(jù)。
完成用戶標簽提取后,可以通過各類直觀的方式展現(xiàn)用戶畫像。例如,可以利用直方圖、雷達圖等各類統(tǒng)計圖呈現(xiàn)效果,或者借助標簽云,結(jié)合人物圖片和用戶標簽進行呈現(xiàn)。其中,用戶畫像越清晰,對應(yīng)的特征值和標簽越多,反之則越少。同時,為了深入研究用戶畫像的應(yīng)用,還需要構(gòu)建群體畫像,通過歸納總結(jié)形成具有相近信息化素養(yǎng)和能力的用戶群體畫像。個人畫像和群體畫像的構(gòu)建,方便觀察和分析個體與群體的特征及發(fā)展趨勢,為后續(xù)用戶畫像的應(yīng)用提供基礎(chǔ)數(shù)據(jù)。
智慧服務(wù)模型算法
為了更好地為學生提供服務(wù),需要構(gòu)建相關(guān)的智慧服務(wù)模型,匹配關(guān)聯(lián)用戶畫像,并不斷完善相關(guān)算法。根據(jù)用戶畫像模型,采用多種方式相結(jié)合的數(shù)據(jù)挖掘算法,分析和預(yù)測用戶的資源需求和行為趨勢,然后通過高效的信息化手段,為用戶提供有價值的信息資源和服務(wù)。
構(gòu)建用戶畫像和資源服務(wù)之間的智能推薦模型,根據(jù)學生的基礎(chǔ)信息化素養(yǎng)和社交行為數(shù)據(jù)構(gòu)建用戶畫像,同時對所提供的課程內(nèi)容、培訓(xùn)服務(wù)、圖書資料等進行數(shù)據(jù)分析挖掘,匹配關(guān)聯(lián)兩者,從而實現(xiàn)精準的網(wǎng)絡(luò)安全教育資源推送服務(wù)。構(gòu)建學生個體與群體之間的智能分析模型,根據(jù)個體畫像和群體畫像數(shù)據(jù),分析預(yù)測學生個體和群體的網(wǎng)絡(luò)安全素養(yǎng)發(fā)展規(guī)律,提高網(wǎng)絡(luò)安全素養(yǎng),預(yù)防網(wǎng)絡(luò)安全事件的發(fā)生。
基于內(nèi)容推薦算法是常用的推薦算法之一,它匹配用戶的喜好和擬推薦內(nèi)容之間的相似程度,將用戶喜歡的資源內(nèi)容推薦給目標用戶,實現(xiàn)精準化服務(wù)。深度學習算法是近年來系統(tǒng)領(lǐng)域的研究熱點,利用深度神經(jīng)網(wǎng)絡(luò)的強大表征能力,提高預(yù)測的準確性和效果。
開展智慧服務(wù)
1. 為學生推送精準化的網(wǎng)絡(luò)安全資源和培訓(xùn)服務(wù)
學生用戶畫像的構(gòu)建,使得學校開展精準化教學成為可能。高校可以根據(jù)學生的特點、需求、愛好等,為學生提供精準化的網(wǎng)絡(luò)安全資源和培訓(xùn)服務(wù)。
根據(jù)用戶畫像,利用大數(shù)據(jù)分析,實現(xiàn)精準化的資源推送。例如,根據(jù)學生的專業(yè)、年級以及專業(yè)課程,為其推送個性化的信息化、網(wǎng)絡(luò)安全相關(guān)資料;根據(jù)學生的興趣愛好,為其推送相關(guān)的課程、視頻、課件等。
根據(jù)用戶畫像,分析用戶的需求變化,制定相關(guān)的培訓(xùn)計劃,提供精準的服務(wù)內(nèi)容,從而滿足用戶的需求。例如,非電信專業(yè)的學生,平時接觸計算機網(wǎng)絡(luò)較少,可以根據(jù)學生生源、專業(yè)等特點,提供對應(yīng)的信息素養(yǎng)培訓(xùn);針對大一新生,推送個性化的培訓(xùn)、講座、知識競賽等,提高新生的網(wǎng)絡(luò)安全意識;通過大數(shù)據(jù)分析,統(tǒng)計各個分院的網(wǎng)絡(luò)安全問題,針對問題較多的學院,制定相應(yīng)的培訓(xùn)方案,降低安全事件發(fā)生概率。
2. 為學生制定個性化的網(wǎng)絡(luò)安全教育策略
利用學生用戶畫像開展教學活動,提高學生網(wǎng)絡(luò)安全防范意識和能力,構(gòu)建一個以提升學生網(wǎng)絡(luò)安全素養(yǎng)為目標的教學模式。在日常教學過程和實踐活動中,加入學生畫像,根據(jù)學生學習數(shù)據(jù)、活動數(shù)據(jù)、互動數(shù)據(jù)、行為數(shù)據(jù)等,分析學生的信息化能力和網(wǎng)絡(luò)安全意識,推送相關(guān)專業(yè)課程學習資料,把提升學生網(wǎng)絡(luò)安全素養(yǎng)嵌入課堂中。同時也可以根據(jù)學生能力范圍、興趣愛好等,把學生分為不同的小組,開展不同類型的教學活動、教學評估,實現(xiàn)個性化教學方式。
為豐富用戶畫像內(nèi)容,可以將信息素養(yǎng)教學融入學校的第二課堂活動、實踐項目、工作坊等,涵蓋學生的整個學習生涯。分析用戶畫像與群體畫像內(nèi)容,為學生提供針對性、漸進式的培訓(xùn)和咨詢,彌補學生的不足之處,鍛煉學生的實踐能力和學習能力。
3. 輔助管理層制定科學的決策
大數(shù)據(jù)畫像技術(shù)不僅在學生教學的精準化、個性化方面發(fā)揮重要作用,對于管理層而言,還起到輔助科學決策的作用。學校的領(lǐng)導(dǎo)者通過數(shù)據(jù)分析和挖掘?qū)W生畫像,可以知道每個分院學生對信息化素養(yǎng)和網(wǎng)絡(luò)安全的了解程度,從頂層設(shè)計出發(fā),制定相應(yīng)的人才培養(yǎng)方案和課程設(shè)計。信息化工作者通過分析個體畫像和群體畫像,從網(wǎng)絡(luò)安全角度出發(fā),制定相應(yīng)的防護措施和策略,增添防火墻、審計設(shè)備、監(jiān)管設(shè)備等,制定細化的黑白名單策略,重點關(guān)注網(wǎng)絡(luò)安全意識不足的分院和對象,降低網(wǎng)絡(luò)安全風險。分院學工老師通過對學生數(shù)據(jù)長期、持續(xù)追蹤和分析,動態(tài)調(diào)整網(wǎng)絡(luò)安全教育策略,同時重視學生反饋,做好反饋機制,針對性地為學生提供更具有價值、更貼近學生需求的教育服務(wù),提高學生體驗感。
4. 動態(tài)預(yù)測趨勢,開展針對性措施
利用用戶畫像還能動態(tài)預(yù)測用戶個體和群體的發(fā)展規(guī)律。通過分析用戶畫像和動態(tài)數(shù)據(jù),可以檢測追蹤學生群體的變化規(guī)律和群體性特征,依據(jù)學生群體的變化特征,動態(tài)調(diào)整相應(yīng)的教學方案和計劃,保障教學質(zhì)量,提高教學效率。
同時,大數(shù)據(jù)畫像技術(shù)還可以用于預(yù)測趨勢,對于有潛在網(wǎng)絡(luò)安全風險的個體或群體,及時做出針對性干預(yù),給出個性化的防范建議和服務(wù)推送。例如,對于非工科類專業(yè)學生,積極推送個性化的學習資源和培訓(xùn)服務(wù),防患于未然;對學生上網(wǎng)行為數(shù)據(jù)進行實時追蹤和分析,發(fā)現(xiàn)學生訪問不良網(wǎng)站時,及時采取相應(yīng)的措施,如彈窗警告、短信通知等,糾正學生的錯誤行為;對一卡通、微信、支付寶等消費交易數(shù)據(jù)進行分析和追蹤,重點關(guān)注大額消費和突發(fā)性消費。
結(jié)束語
信息化的飛速發(fā)展對大學生網(wǎng)絡(luò)安全教育提出更高的要求。加強大學生的網(wǎng)絡(luò)安全教育,既是培養(yǎng)新時代高素質(zhì)人才的需求,也是穩(wěn)定校園環(huán)境、保障學生安全的需求。在大數(shù)據(jù)時代,傳統(tǒng)的網(wǎng)絡(luò)安全教育模式亟待改變,大數(shù)據(jù)畫像技術(shù)在高校網(wǎng)絡(luò)安全教育的應(yīng)用打破了傳統(tǒng)的教育模式,利用大數(shù)據(jù)平臺對用戶數(shù)據(jù)進行充分挖掘,教育過程從“經(jīng)驗型”模式向“數(shù)據(jù)支持型”模式轉(zhuǎn)變,使得決策更加科學和有效。利用大數(shù)據(jù)畫像技術(shù),能在海量的信息中挖掘出潛在的價值,即學生的個體和群體特征,為學生提供精準的個性化推送,制定專門的教學方式,為個性化教學提供基礎(chǔ)保障。利用大數(shù)據(jù)畫像能夠提高教學效率,實現(xiàn)數(shù)字化教育新模式。
來源:《中國教育網(wǎng)絡(luò)》2024年8月刊