成人精品水蜜桃_成人在线丰满少妇av_91亚洲国产高清_欧美日韩免费区域视频在线观看

首頁 智能 > 正文

AI智能評(píng)分相差甚遠(yuǎn) 真的靠譜嗎?

隨著人工智能的發(fā)展,有不少App都應(yīng)用了智能評(píng)分系統(tǒng)。但同時(shí),也有不少家長吐槽英語跟讀App評(píng)分,英語專業(yè)八級(jí)水平的得分也只有80分。

除了應(yīng)用于口語語音智能評(píng)分,人工智能還被應(yīng)用于判卷上。不過,近日一款號(hào)稱服務(wù)于美國兩萬所學(xué)校的AI教學(xué)平臺(tái)卻翻車了,被“打臉”的就是搭載在平臺(tái)上的AI閱卷系統(tǒng),學(xué)生們借助它的漏洞“裸考”就能輕松及格。之所以被學(xué)生們鉆了“空子”,是由于該系統(tǒng)只是通過關(guān)鍵詞進(jìn)行評(píng)分,學(xué)生們只要借助題目中的“關(guān)鍵詞沙拉”,就能順利過關(guān)甚至獲得高分。

閱卷前需先設(shè)定評(píng)判標(biāo)準(zhǔn)

“自動(dòng)測評(píng)打分、閱卷系統(tǒng)一般需要先設(shè)定評(píng)測的標(biāo)準(zhǔn),而后根據(jù)設(shè)定的標(biāo)準(zhǔn)去設(shè)計(jì)合適的評(píng)測算法與模型。”天津大學(xué)智能與計(jì)算學(xué)部教授、博士生導(dǎo)師熊德意介紹,比如像口語測評(píng)打分,就需要機(jī)器去評(píng)判人的發(fā)音是否標(biāo)準(zhǔn),所讀句子的重音是否正確,讀出的語句是否連貫流暢,連讀部分是否準(zhǔn)確等。這些都可能是評(píng)判的標(biāo)準(zhǔn)。

AI閱卷系統(tǒng)則涉及到對(duì)語言文字的評(píng)判,涵蓋很多方面,如語法、語義等,會(huì)大量運(yùn)用到自然語言處理技術(shù)。

“自然語言處理是人工智能的一個(gè)重要分支,研究利用計(jì)算機(jī)對(duì)自然語言進(jìn)行智能化處理,基礎(chǔ)的自然語言處理技術(shù)主要圍繞語言的不同層級(jí)展開,包括音位(語言的發(fā)音模式)、形態(tài)(字、字母如何構(gòu)成單詞、單詞的形態(tài)變化)、詞匯(單詞之間的關(guān)系)、句法(單詞如何形成句子)、語義(語言表述對(duì)應(yīng)的意思)、語用(不同語境中的語義解釋)、篇章(句子如何組合成段落)7個(gè)層級(jí)”熊德意強(qiáng)調(diào),這些基本的自然語言處理技術(shù)經(jīng)常被運(yùn)用到下游的多種自然語言處理任務(wù)(如機(jī)器翻譯、對(duì)話、問答、文檔摘要等)中,自動(dòng)閱卷中的語言文字評(píng)測通常涉及這7個(gè)層級(jí)的若干層。

設(shè)計(jì)自動(dòng)評(píng)測指標(biāo)的方法有多種,通常會(huì)根據(jù)不同的評(píng)判類型去選擇適合的方法。“比如閱卷系統(tǒng)若要進(jìn)行翻譯題的自動(dòng)評(píng)判,可以讓老師事先寫好多個(gè)參考譯文答案,然后把學(xué)生的答案和參考答案進(jìn)行類比。計(jì)算它們的相似度作為學(xué)生答案好壞的評(píng)測指標(biāo)。”熊德意舉例說,機(jī)器翻譯常用的評(píng)測指標(biāo)BLEU,就是基于參考譯文和機(jī)器譯文之間的N-grams(N元)匹配度計(jì)算相似度的。

一個(gè)單詞是一元,兩個(gè)相連的單詞是二元,還有三元、四元,如果答案中有一個(gè)單詞與參考答案中的單詞一致,那么就會(huì)給出一個(gè)一元評(píng)分,類似地可以計(jì)算二元、三元、四元的評(píng)分。我們?yōu)椴煌O(shè)置不同權(quán)重,然后把得分統(tǒng)籌起來變成一個(gè)客觀值,得分越高就說明兩者之間的相似性越高。

為啥不同AI評(píng)分相差甚遠(yuǎn)

此次AI閱卷翻車的導(dǎo)火索是一個(gè)歷史系的教授的學(xué)霸兒子在進(jìn)行歷史考試的時(shí)候只得到了50%的分?jǐn)?shù),而她對(duì)兒子的答案進(jìn)行評(píng)測后,覺得孩子的回答是基本沒有問題的。

同樣的答案,人工評(píng)價(jià)和機(jī)器評(píng)價(jià)為何有如此大的出入?

“這就是基于AI算法的自動(dòng)評(píng)測面臨的最大挑戰(zhàn):如何與人工評(píng)價(jià)保持一致。應(yīng)對(duì)這個(gè)挑戰(zhàn)需要解決的問題很多。比如如何制定合適的評(píng)測標(biāo)準(zhǔn),主觀題進(jìn)行自動(dòng)評(píng)測必須要有合適的評(píng)測標(biāo)準(zhǔn)和規(guī)范;比如如何應(yīng)對(duì)語言的千變?nèi)f化,語言的多樣性是自然語言處理的主要挑戰(zhàn)之一,語言的自動(dòng)測評(píng)和自動(dòng)處理都要面對(duì)多樣性的挑戰(zhàn);比如如何設(shè)計(jì)一個(gè)綜合性的評(píng)測指標(biāo),雖然目前有各種各樣的指標(biāo),但是很少有指標(biāo)綜合考慮語言文字的方方面面,例如作文自動(dòng)閱卷,可能要考慮用詞是否合理(詞匯)、句子是否流暢(句法)、段落組織是否有條理(篇章)、內(nèi)容是否扣題(語義、語用)等”熊德意說,上面提到的BLEU就是只考慮了單詞形式的嚴(yán)格匹配,沒有考慮單詞的形態(tài)變化、語義相似性、譯文的句法合理性等因素。

“遵循的評(píng)測規(guī)則、評(píng)判的出發(fā)點(diǎn)不同,相應(yīng)的算法模型都不一樣,因此最后的結(jié)果也會(huì)相差甚遠(yuǎn)。”

因此僅僅利用一種評(píng)測方法顯然是不全面的,這也就解釋了當(dāng)孩子的母親嘗試在答案里加入“財(cái)富、商隊(duì)、中國、印度”等題目中的關(guān)鍵詞,即使這些關(guān)鍵詞之間沒有任何串聯(lián),她也得了滿分。“可能這個(gè)AI閱卷系統(tǒng)只使用了簡單的關(guān)鍵詞匹配,因此會(huì)出現(xiàn)‘關(guān)鍵詞沙拉’也能蒙混過關(guān)的情況。”熊德意解釋。

此外,口語的人工測評(píng)與機(jī)器測評(píng)也存在較大出入。“近年來,語音識(shí)別性能雖然在深度學(xué)習(xí)技術(shù)的推動(dòng)下取得了顯著的提升,但是在開放域、噪音環(huán)境下,這種識(shí)別率就會(huì)下降很多。”熊德意解釋。如果機(jī)器“聽”錯(cuò)了一個(gè)單詞,而后機(jī)器進(jìn)行測評(píng),就會(huì)形成一個(gè)錯(cuò)誤傳播,也就是上游系統(tǒng)的錯(cuò)誤會(huì)導(dǎo)致下一系統(tǒng)錯(cuò)誤,錯(cuò)上加錯(cuò),越錯(cuò)越離譜,測評(píng)結(jié)果也會(huì)大相徑庭。

“目前有很多設(shè)計(jì)評(píng)測指標(biāo)的方法,還有很多改進(jìn)的方法,如在計(jì)算準(zhǔn)確率同時(shí)也計(jì)算召回率等。另外,還有對(duì)評(píng)測指標(biāo)進(jìn)行評(píng)測,即評(píng)測的評(píng)測,看看哪個(gè)評(píng)測指標(biāo)更完善,更和人的評(píng)價(jià)一致。”熊德意感嘆,自動(dòng)評(píng)測的難度和對(duì)應(yīng)的自然語言處理任務(wù)的難度,很多時(shí)候,從技術(shù)層面來說是一樣的,比如用機(jī)器評(píng)價(jià)一個(gè)譯文的好壞與用機(jī)器生成一個(gè)譯文的難度類似,用機(jī)器評(píng)判一個(gè)文檔摘要的好壞與用機(jī)器生成一個(gè)摘要的難度也差不多。

未來或可以應(yīng)用于評(píng)判閱卷

“傳統(tǒng)的自動(dòng)評(píng)測指標(biāo)通常是基于符號(hào)進(jìn)行計(jì)算的,現(xiàn)在,深度學(xué)習(xí)等AI技術(shù)也越來越多地應(yīng)用于測評(píng)工具中。”熊德意介紹,使用深度學(xué)習(xí),可以把語言符號(hào)映射到實(shí)數(shù)稠密向量的語義空間,利用語義向量計(jì)算相似度。哪怕說的詞語和計(jì)算機(jī)原本學(xué)習(xí)的不一樣,但是語義是一致的,機(jī)器就可以進(jìn)行精準(zhǔn)的評(píng)價(jià)。因此,基于深度學(xué)習(xí)的自動(dòng)評(píng)測某種程度上可以應(yīng)對(duì)語言的多樣性挑戰(zhàn)。

“不過深度學(xué)習(xí)也有一個(gè)問題,就是需要大量的數(shù)據(jù)讓機(jī)器進(jìn)行學(xué)習(xí)。”熊德意解釋,將詞匯表大小維度的獨(dú)熱向量壓縮映射到幾百維的稠密向量,神經(jīng)網(wǎng)絡(luò)需要通過大量數(shù)據(jù)訓(xùn)練,才能學(xué)習(xí)到較好的映射函數(shù)。

基于自監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練語言模型,近幾年,在語言表示學(xué)習(xí)中,取得了突破性的進(jìn)展。“OpenAI的預(yù)訓(xùn)練語言模型GPT-3,在 5000億單詞的海量語料上訓(xùn)練了一個(gè)帶有1750億個(gè)參數(shù)的神經(jīng)網(wǎng)絡(luò),通過大量學(xué)習(xí)網(wǎng)絡(luò)上各種語言的文本,GPT-3形成了強(qiáng)大的語言表示能力,可以進(jìn)行多種任務(wù),比如自動(dòng)翻譯、故事生成、常識(shí)推理、問答等,甚至可以進(jìn)行加減法運(yùn)算,比如兩位數(shù)加減法100%正確,五位數(shù)加減法正確率接近10%”熊德意介紹,不過 這么龐大的神經(jīng)網(wǎng)絡(luò),如果用單精度浮點(diǎn)數(shù)存儲(chǔ),需要700G的存儲(chǔ)空間,另外模型訓(xùn)練一次就花費(fèi)了460萬美元。因此,即使GPT-3具有較好的零樣本、小樣本學(xué)習(xí)能力,其高昂的成本使其離普遍可用還有很遠(yuǎn)的距離。

但是AI作為閱卷評(píng)測“老師”,其又有人工不可比擬的優(yōu)勢。比如AI自動(dòng)批閱卷系統(tǒng)相比人工批閱速度更快,老師不可能一次記住所有的多項(xiàng)選擇題答案,需要不斷檢查標(biāo)準(zhǔn)答案,這是很費(fèi)時(shí)的,自動(dòng)批閱系統(tǒng)幫助老師大大提高了效率;另外,自動(dòng)批閱系統(tǒng)更加理性,不受外界條件干擾,不因疲勞等原因?qū)е抡`判。即使在復(fù)雜的干擾環(huán)境中,仍然可以得到正確的結(jié)果;AI閱卷系統(tǒng)還可以在評(píng)分后直接做好學(xué)情分析,統(tǒng)計(jì)出考試數(shù)據(jù)、錯(cuò)題數(shù)據(jù)等教學(xué)材料,幫助老師減負(fù)、增效,幫助學(xué)生提高學(xué)習(xí)效率。

“將主觀題合理地客觀化(比如變成選擇題),可以降低自動(dòng)閱卷的難度。”熊德意表示,對(duì)無法客觀化的主觀題,雖然設(shè)定全面的評(píng)測標(biāo)準(zhǔn)比較難,但是設(shè)定某一方面的評(píng)測標(biāo)準(zhǔn)還是可行的,比如針對(duì)單詞詞法、句子語法的評(píng)判,目前準(zhǔn)確率還是挺高的,這類技術(shù)可以從實(shí)驗(yàn)室走向產(chǎn)品應(yīng)用。

也可以引入人工評(píng)測,對(duì)AI閱卷系統(tǒng)打分進(jìn)行復(fù)核與修正,通過這種反復(fù)的修正,累積大量的評(píng)測訓(xùn)練數(shù)據(jù),讓機(jī)器評(píng)分變得更加智能。

“利用自然語言處理等人工智能技術(shù),進(jìn)一步完善主觀智能評(píng)分系統(tǒng),將是未來教育領(lǐng)域的一個(gè)非常重要的課題。”熊德意充滿信心地說,以后的AI自動(dòng)批閱系統(tǒng)肯定會(huì)越來越“聰明”,人工智能與教育的結(jié)合也會(huì)越來越緊密。(科技日?qǐng)?bào)記者 陳曦)

關(guān)鍵詞: AI閱卷 評(píng)分系統(tǒng)

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - m.7778890.com All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號(hào)-12

 

成人精品水蜜桃_成人在线丰满少妇av_91亚洲国产高清_欧美日韩免费区域视频在线观看
欧美破处大片在线视频| 国产精品magnet| 色又黄又爽网站www久久| 中文文精品字幕一区二区| 福利91精品一区二区三区| 在线观看免费亚洲| 天天影视色香欲综合网老头| 亚洲性图久久| 中文字幕第一区二区| 白白色 亚洲乱淫| 日韩欧美亚洲国产另类| 久久成人精品无人区| 色婷婷久久久综合中文字幕| 亚洲一区av在线| 国产伦精品一区二区三区四区免费| 国产精品白丝在线| 欧美连裤袜在线视频| 中文字幕欧美三区| 欧美特黄一级| 国产精品国产三级国产| 亚洲婷婷免费| 亚洲欧美综合另类在线卡通| 国产精品九九| 亚洲免费观看在线视频| 亚洲人成毛片在线播放女女| 亚洲精品乱码久久久久久黑人| 亚洲电影自拍| 一区二区三区在线不卡| 午夜在线一区二区| 免费成人你懂的| 欧美日韩1区2区| 成人免费福利片| 日本一区免费视频| 91久久黄色| 天天综合网 天天综合色| 日本道免费精品一区二区三区| 青青草原综合久久大伊人精品| 在线中文字幕不卡| 丰满少妇在线播放bd日韩电影| 精品成人佐山爱一区二区| 91视频在线看| 亚洲欧洲av在线| 色哟哟精品一区| 国产一区二区三区在线看麻豆| 欧美成人官网二区| 国产字幕视频一区二区| 亚洲一区在线视频| 欧美性色欧美a在线播放| 国产精品 日产精品 欧美精品| 久久午夜羞羞影院免费观看| 精品成人一区| 蜜桃久久久久久| 欧美va亚洲va香蕉在线| 亚洲一级二级| 秋霞电影一区二区| 久久五月婷婷丁香社区| 亚洲精品一区二区三区樱花| 日本欧美一区二区三区乱码| 欧美一级久久久| 精品福利电影| 久久国产精品99久久久久久老狼| 精品国产乱码久久久久久老虎| 亚洲精品乱码久久久久久蜜桃91| 日本美女视频一区二区| 精品国产一区二区三区四区四| 亚洲激情偷拍| 国产一区二区三区免费播放| 国产精品三级久久久久三级| 91高清在线观看| 女女同性精品视频| 美腿丝袜亚洲三区| 国产精品视频一二| 欧美日韩免费一区二区三区| 国产精品v一区二区三区| 蜜臀久久久久久久| 中文av一区二区| 欧美视频一二三区| 在线日韩av| 国产99久久久久久免费看农村| 伊人一区二区三区| 26uuu色噜噜精品一区二区| 久久久蜜桃一区二区人| 欧美在线免费| 狠狠色综合日日| 一区二区三国产精华液| 日韩视频免费观看高清完整版在线观看 | 亚洲观看高清完整版在线观看| 欧美亚洲禁片免费| 欧美国产精品| 亚洲国产精品欧美一二99| 欧美一区二区视频在线观看| 精品1区2区| 国产一区二区三区| 一区二区在线观看不卡| 欧美一二三在线| 国产精品美女久久久| 国产+成+人+亚洲欧洲自线| 一区二区欧美视频| 久久香蕉国产线看观看99| 亚洲欧美日本日韩| 91丝袜美女网| 精品夜夜嗨av一区二区三区| 日韩丝袜美女视频| 欧美怡红院视频| 亚洲国产一区二区在线| 国产精品一区三区| 亚洲自拍偷拍网站| 久久久不卡影院| 欧美日韩亚洲不卡| 国产精品久久777777毛茸茸| 欧美高清视频一区| 国产一区二区美女诱惑| 一区二区三区精品在线观看| 精品日韩av一区二区| 久久午夜精品| 精品动漫3d一区二区三区免费版 | 亚洲色欲色欲www| 精品毛片乱码1区2区3区 | 处破女av一区二区| 亚洲一区二区在线播放相泽| 中文字幕精品在线不卡| 欧美一卡2卡三卡4卡5免费| 久久婷婷麻豆| 一区二区福利| 狠狠色综合网| 欧美一区成人| 成人免费视频免费观看| 免费人成精品欧美精品 | 精品成人一区二区三区四区| 欧美视频完全免费看| 免费在线亚洲| 在线视频日韩| 亚洲欧美日产图| 99精品欧美| 亚洲成人自拍视频| 午夜精品视频| eeuss国产一区二区三区| 91香蕉视频污在线| 成人一区在线观看| 国产夫妻精品视频| 国产激情视频一区二区三区欧美| 亚洲成人久久影院| 亚洲一区二区四区蜜桃| 亚洲欧美日韩电影| 亚洲成人激情社区| 亚洲成人资源网| 亚洲成人免费视频| 亚瑟在线精品视频| 午夜成人在线视频| 狠狠色狠狠色综合日日91app| 日韩在线观看一区二区| 午夜免费久久看| 日韩制服丝袜av| 免费三级欧美电影| 粉嫩久久99精品久久久久久夜| 国精产品一区一区三区mba视频| 久久精品国产一区二区三| 蜜臀av性久久久久蜜臀aⅴ流畅 | 欧美日韩精品欧美日韩精品一| 日本精品一区二区三区四区的功能| 欧美亚洲在线| 久久一区二区三区超碰国产精品| 久久国产精品毛片| 久久影院亚洲| 久久激情一区| 91精品国产91久久综合桃花| 日韩欧美精品三级| 久久欧美一区二区| 亚洲国产精品传媒在线观看| 国产精品久久久久久久久晋中 | 男女av一区三区二区色多| 久久久久九九九| 色爱区综合激月婷婷| 欧美日韩国产成人在线免费| 欧美一区二区三区在线电影| 在线免费视频一区二区| 欧美大片拔萝卜| 欧美极品xxx| 亚洲猫色日本管| 日韩成人精品在线观看| 亚洲成人免费影院| 成人毛片老司机大片| 91免费看`日韩一区二区| 亚洲一级电影| 色婷婷狠狠综合| 欧美日韩国产首页| 国产精品久久久爽爽爽麻豆色哟哟| 亚洲欧美一区二区久久| 日韩av一二三| 大白屁股一区二区视频| 97se亚洲国产综合自在线观| 亚洲综合好骚| 91精品欧美久久久久久动漫| 51精品视频一区二区三区| 国产日韩欧美亚洲| 伊人夜夜躁av伊人久久| 国产成a人无v码亚洲福利| 红桃视频国产精品| 91传媒视频在线播放| 国产亚洲精久久久久久|