⊙ 本文長約1.3萬字,閱讀需時(shí)33分鐘
本文來源:北大法寶法學(xué)期刊庫
《清華法學(xué)》2022年第3期
作者:左衛(wèi)民 四川大學(xué)法學(xué)院教授
中國計(jì)算法學(xué)的未來:審思與前瞻音頻:00:0043:02
摘要:作為一門尚處于概念凝練、知識(shí)醞釀階段的新學(xué)科,計(jì)算法學(xué)的實(shí)踐效果還未充分顯現(xiàn),其前景有著不確定性。充分應(yīng)用統(tǒng)計(jì)學(xué)知識(shí)、機(jī)器學(xué)習(xí)方法的計(jì)算法學(xué)與法律實(shí)證研究本質(zhì)上是“一體兩面”的關(guān)系,兩者在研究對象和方法等方面具有共通性。計(jì)算法學(xué)應(yīng)該在法律實(shí)證研究基礎(chǔ)上衍生與拓展,成為實(shí)證研究的2.0版。具備公開且定量化、可以模式識(shí)別、具有相對確定數(shù)量關(guān)系的數(shù)據(jù)才能被有效計(jì)算,計(jì)算法學(xué)的核心方法應(yīng)是統(tǒng)計(jì)學(xué)與機(jī)器學(xué)習(xí)方法,其關(guān)鍵是獲得較高的數(shù)據(jù)擬合度,通過分析歷史數(shù)據(jù),“預(yù)測”法律的運(yùn)行現(xiàn)象。此類預(yù)測雖然可以揭示法律現(xiàn)象之間的“相關(guān)性”,但難以發(fā)現(xiàn)法律實(shí)踐的“因果律”。相比法律人的決策,機(jī)器學(xué)習(xí)式的計(jì)算在視角、效率、成本收益等方面存在局限性。未來,計(jì)算法學(xué)需要結(jié)合我國法律數(shù)據(jù)的“本土資源”,探索可行的法律計(jì)算思路與計(jì)算方法,致力于揭示法律實(shí)踐規(guī)律,驗(yàn)證、補(bǔ)充和修正法學(xué)理論,以打造中國計(jì)算法學(xué)的“拳頭產(chǎn)品”,促進(jìn)計(jì)算法學(xué)的落地生根。
關(guān)鍵詞:計(jì)算法學(xué);法律實(shí)證研究;計(jì)算科學(xué);機(jī)器學(xué)習(xí)
近年來,“計(jì)算法學(xué)”逐漸成為法學(xué)界的高頻熱詞。例如,若干法學(xué)院校開設(shè)了計(jì)算法學(xué)課程、法學(xué)與計(jì)算機(jī)的雙學(xué)位專業(yè),甚至開始在計(jì)算法學(xué)相關(guān)領(lǐng)域招收研究生。中國計(jì)算機(jī)協(xié)會(huì)(CCF)也成立了計(jì)算法學(xué)行業(yè)分會(huì)以促進(jìn)計(jì)算法學(xué)的發(fā)展。伴隨數(shù)據(jù)時(shí)代來臨,法律實(shí)踐更容易被數(shù)據(jù)記錄、捕獲,奠定了法律計(jì)算的數(shù)據(jù)基礎(chǔ)。隨機(jī)森林、聚類算法、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法的出現(xiàn),為法律計(jì)算的實(shí)現(xiàn)提供了可能。上述種種,似乎預(yù)示計(jì)算法學(xué)正在興起。然而,關(guān)于計(jì)算法學(xué)的發(fā)展卻存在著兩種聲音:其一,計(jì)算法學(xué)正在興起。在國內(nèi),已有文章開始探討計(jì)算法學(xué)的概念與內(nèi)涵。計(jì)算法學(xué)似乎正成為一種新的發(fā)展趨勢。其二,計(jì)算法學(xué)并未成為獨(dú)立且成熟的學(xué)科。在部分學(xué)者看來,國內(nèi)尚未有成熟的計(jì)算法學(xué)概念、成果涌現(xiàn),計(jì)算法學(xué)既沒有有效的計(jì)算方法,又缺乏可行的計(jì)算思路,計(jì)算法學(xué)的發(fā)展可能受到諸多質(zhì)疑,似乎難以成為一個(gè)獨(dú)立的學(xué)科。
筆者認(rèn)為,中國的計(jì)算法學(xué)的前景如何,取決于其是否能夠完整經(jīng)歷從知識(shí)醞釀或引介,到概念凝練和學(xué)科構(gòu)建,再到研究方法成熟的過程。對于剛剛走在知識(shí)醞釀階段的新學(xué)科而言,其研究前景還有諸多的不確定性。關(guān)于計(jì)算法學(xué)在中國的未來,我們需要討論三點(diǎn):第一,計(jì)算法學(xué)的概念范疇。什么研究才能稱為計(jì)算法學(xué)研究?抑或是計(jì)算法學(xué)的概念與定義是什么?第二,計(jì)算法學(xué)應(yīng)當(dāng)如何計(jì)算??梢杂?jì)算的法律經(jīng)驗(yàn)數(shù)據(jù)是什么?用以法律計(jì)算的方法是什么?第三,計(jì)算法學(xué)的前途。即法律的計(jì)算效果究竟如何?未來的計(jì)算法學(xué)學(xué)科應(yīng)該如何發(fā)展?
一、計(jì)算法學(xué):概念為何?
何謂計(jì)算法學(xué)?這是一個(gè)尚未充分明確的問題。在域外,理論界實(shí)際上較少直接使用計(jì)算法學(xué)的稱謂,相鄰概念主要涉及計(jì)算社會(huì)科學(xué)(computational social science)、法律計(jì)量學(xué)(jurimetrics)、法律信息學(xué)(legal informatics)等。具體而言,可從以下方面把握域外計(jì)算法學(xué)的相關(guān)概念。
第一,從計(jì)算社會(huì)科學(xué)(computational social science)角度把握。按照克勞迪奧·喬菲雷維利亞(Claudio Cioffi-Revilla)的定義:“計(jì)算社會(huì)科學(xué)是以計(jì)算為媒介,對社會(huì)學(xué)領(lǐng)域開展的跨學(xué)科研究,使用大數(shù)據(jù)、云計(jì)算和智能機(jī)器人等計(jì)算機(jī)技術(shù)進(jìn)行的數(shù)據(jù)挖掘?!?009年,由15位學(xué)者在自然科學(xué)領(lǐng)域內(nèi)權(quán)威期刊《科學(xué)》(Science)雜志刊發(fā)的《網(wǎng)絡(luò)生活:計(jì)算社會(huì)科學(xué)時(shí)代即將到來》指出:通過大量社會(huì)信息,計(jì)算和預(yù)測人類的交流、互動(dòng)將成為計(jì)算社會(huì)科學(xué)的主要研究領(lǐng)域。據(jù)此,計(jì)算社會(huì)科學(xué)被視為一種充分使用大數(shù)據(jù)和依托計(jì)算科學(xué)方法的社會(huì)科學(xué)研究。計(jì)算法學(xué)的概念自然也需要放在計(jì)算社會(huì)科學(xué)的框架下把握。
第二,從量化研究角度把握。法律計(jì)量學(xué)的最早倡導(dǎo)者洛文杰(Loevinger)在《法律計(jì)量學(xué):前進(jìn)的下一步》一文中主張,將量化思維引入法律分析過程,強(qiáng)調(diào)使用概率統(tǒng)計(jì)方法來測量證人、法官與立法者行為。我國有學(xué)者則將其翻譯為“計(jì)量法學(xué)”或“數(shù)量法學(xué)”,所謂“計(jì)量法學(xué)”是一種使用法律實(shí)證分析,以數(shù)據(jù)建模為方法,從事判決預(yù)測與制度評價(jià)的研究。計(jì)算法學(xué)便應(yīng)當(dāng)從法律量化的角度加以理解。
第三,從法律信息的角度闡釋。自從香農(nóng)創(chuàng)立信息學(xué)以來,信息就成為計(jì)算機(jī)技術(shù)研究的對象。法律信息學(xué)開始成為信息學(xué)的分支之一,如根據(jù)美國斯坦福大學(xué)法律信息中心杰內(nèi)塞雷斯(Michael Genesereth)的論斷,計(jì)算法學(xué)是法律信息學(xué)的組成部分,而法律信息學(xué)是法律推理的一種方法,依托現(xiàn)代信息技術(shù)的法律分析可以極大地改變法律行業(yè),提高法律服務(wù)的質(zhì)量和效率,從而提高獲得司法公正的機(jī)會(huì),并改善整個(gè)法律體系。據(jù)此,計(jì)算法學(xué)的概念應(yīng)當(dāng)在法律信息學(xué)的范疇內(nèi)理解與把握。然而,法律信息學(xué)的概念似乎還沒有獲得理論界的普遍性認(rèn)可,域外代表性的研究成果尚不多見。
整體上,具備成熟研究思路和方法的計(jì)算社會(huì)科學(xué)(computational social science)已在數(shù)據(jù)與人工智能風(fēng)起云涌的歐美社科界蔚然成風(fēng)。在筆者看來,其原因可能與域外社會(huì)科學(xué)界包括法學(xué)界如美國實(shí)證研究已經(jīng)成為主流研究范式有關(guān)。歐美社科界很多研究者具備很強(qiáng)的統(tǒng)計(jì)分析能力,并在多領(lǐng)域開展實(shí)證研究包括法律實(shí)證研究。同時(shí),當(dāng)前域外研究者包括實(shí)證研究者通過長期關(guān)注并不斷吸收機(jī)器學(xué)習(xí)等計(jì)算科學(xué)的方法,展開新的科學(xué)研究包括新的實(shí)證研究,相關(guān)研究成果甚至可能促進(jìn)法學(xué)與人工智能技術(shù)的跨界融合。實(shí)際上,我們已經(jīng)見到域外司法人工智能技術(shù)的發(fā)展往往伴隨著法律實(shí)證研究成果的實(shí)踐應(yīng)用,美國COMPAS軟件與法國Predictice軟件對裁判結(jié)果預(yù)測的實(shí)踐應(yīng)用即是最好的例子。以“做實(shí)證研究”來促進(jìn)法律人工智能技術(shù)的發(fā)展,進(jìn)而尋求在重大問題上的研究共識(shí),正在成為美國式法律實(shí)證研究(計(jì)算法學(xué))發(fā)展的新方向。
與域外不同,計(jì)算法學(xué)在中國的出現(xiàn),可能與新文科的興起,相關(guān)學(xué)術(shù)組織的成立,以及計(jì)算法學(xué)論文的發(fā)表有關(guān)。具體來看,國內(nèi)對計(jì)算法學(xué)概念的研討,大致可以分為兩種進(jìn)路。第一種進(jìn)路中的計(jì)算法學(xué)是“法律與計(jì)算、科技”的結(jié)合,認(rèn)為使用計(jì)算機(jī)技術(shù)研究傳統(tǒng)法學(xué)問題即是計(jì)算法學(xué)。應(yīng)用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對海量裁判文書中的數(shù)據(jù)提取、要素輸出和準(zhǔn)確率檢查等就是計(jì)算法學(xué)的研究成果。這種理解往往將“計(jì)算法學(xué)”簡單理解為“法律與科技、計(jì)算”的結(jié)合,并進(jìn)一步認(rèn)為,在法律數(shù)據(jù)完備、真實(shí)、精確的前提下,通過計(jì)算方式研究法律數(shù)據(jù),從而設(shè)計(jì)出一系列智能化產(chǎn)品,為立法與司法活動(dòng)提供重要參考。據(jù)此來看,這種進(jìn)路將法律人工智能相關(guān)技術(shù)作為焦點(diǎn),在識(shí)別、轉(zhuǎn)換法律文本為法律數(shù)據(jù)方面做了不少努力,如應(yīng)用自然語義識(shí)別、裁判文書提取等,但在文字轉(zhuǎn)換成為數(shù)據(jù)之后,如何展開數(shù)據(jù)式研究,卻并未有多少應(yīng)用統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)方式展開的研究,也缺乏在此之上的法律人工智能開發(fā),最常見的僅僅是知識(shí)圖譜式的顯示而已。同時(shí),這種定位還將法律與科技的結(jié)合問題,如法律如何規(guī)制大數(shù)據(jù)、人工智能應(yīng)用的相關(guān)問題作為學(xué)術(shù)研究的關(guān)切點(diǎn)。不過,這種學(xué)科定位與發(fā)展模式僅是“科技”與“法律”簡單交叉的研究定位,可能導(dǎo)致計(jì)算法學(xué)與法律人工智能、司法人工智能的研究內(nèi)容重疊。當(dāng)法律人工智能的發(fā)展在技術(shù)層面需要經(jīng)歷漫長過程,技術(shù)應(yīng)用還可能遭受法律倫理質(zhì)疑之時(shí),這恐怕難以支撐“計(jì)算法學(xué)”成為一門充分展開的獨(dú)立學(xué)科。
第二種路徑認(rèn)為,計(jì)算法學(xué)是一種應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算科學(xué)的相關(guān)知識(shí)、方法展開的法律實(shí)證研究。筆者比較認(rèn)同此種進(jìn)路,但更明確地認(rèn)為:計(jì)算法學(xué)其實(shí)是傳統(tǒng)實(shí)證研究的新階段,它是一種從量的層面研究社會(huì)現(xiàn)象的方法與學(xué)科。作為社會(huì)現(xiàn)象的一種,法律現(xiàn)象也具有量的屬性,可以從量的方法進(jìn)行觀察和研究。根本上,法律實(shí)證研究與計(jì)算法學(xué)的研究對象有著天然共性。如法律實(shí)證研究與計(jì)算法學(xué)都強(qiáng)調(diào)使用統(tǒng)計(jì)學(xué)方法進(jìn)行數(shù)據(jù)的收集、分析,進(jìn)而發(fā)現(xiàn)法律現(xiàn)象的相關(guān)性和因果性。顯然,計(jì)算法學(xué)與法律實(shí)證研究都是一種基于經(jīng)驗(yàn)數(shù)據(jù)的量化研究。至于是否應(yīng)用計(jì)算機(jī)技術(shù)、計(jì)算思維和計(jì)算方法,并不能成為法律實(shí)證研究與計(jì)算法學(xué)的“分水嶺”。當(dāng)前,法律實(shí)證研究成果同樣重視法律大數(shù)據(jù)與計(jì)算機(jī)技術(shù)結(jié)合,主要基于法律現(xiàn)象的經(jīng)驗(yàn)數(shù)據(jù),使用統(tǒng)計(jì)學(xué)與計(jì)算機(jī)科學(xué)的相關(guān)知識(shí)來闡釋法律實(shí)踐。例如,王祿生開發(fā)了分段、分詞檢索工具,實(shí)現(xiàn)對303萬份判決書的自然語義挖掘,形成了一系列的法律實(shí)證研究成果。筆者所著的《刑事辯護(hù)率:差異化及其經(jīng)濟(jì)因素分析》一文,應(yīng)用“爬蟲”軟件對54409份裁判文書進(jìn)行了數(shù)據(jù)挖掘,使用Python語言參與數(shù)據(jù)挖掘和分析工作。同時(shí),美國的實(shí)證研究學(xué)者更是已經(jīng)將決策樹、隨機(jī)森林以及神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法應(yīng)用于法律的實(shí)證研究。通過分析法官經(jīng)驗(yàn)和法律決策模式,使用機(jī)器學(xué)習(xí)方法構(gòu)造和模擬出同人類決策類似的決策模型,并依據(jù)決策模型的研究成果研發(fā)出風(fēng)險(xiǎn)評估和預(yù)測案件裁判結(jié)果的人工智能系統(tǒng)。
如圖1所示,科學(xué)意義上的計(jì)算法學(xué)與法律實(shí)證研究呈現(xiàn)“一體兩面”的關(guān)系。計(jì)算法學(xué)與法律實(shí)證研究在研究對象、研究方法和研究領(lǐng)域上相通,其本質(zhì)上是實(shí)證研究在新材料、新方法興起后的應(yīng)用與拓展。計(jì)算法學(xué)處于統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)與法學(xué)的交叉領(lǐng)域,并非單純強(qiáng)調(diào)計(jì)算科學(xué)方法與計(jì)算機(jī)技術(shù)在法學(xué)領(lǐng)域內(nèi)的推廣,更不是那種既不使用數(shù)據(jù),也不運(yùn)用統(tǒng)計(jì)學(xué)方法,更沒有決策樹、梯度算法等機(jī)器學(xué)習(xí)方法應(yīng)用,僅簡單將法律問題與科學(xué)技術(shù)簡單組合的“偽”計(jì)算研究。至少計(jì)算法學(xué)研究的其中一種應(yīng)是基于法律經(jīng)驗(yàn)現(xiàn)象的數(shù)據(jù)分析與定量研究,以統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)為主要研究方法,實(shí)質(zhì)上是法律實(shí)證研究的最新表述,可以視為法律實(shí)證研究的衍生或者2.0版本。
圖1計(jì)算法學(xué)相關(guān)學(xué)科關(guān)系圖
二、計(jì)算方法:如何計(jì)算法律?
如何計(jì)算法律?一方面,法律的計(jì)算需要有成熟的計(jì)算法學(xué),使用機(jī)器學(xué)習(xí)計(jì)算法律實(shí)踐或法律現(xiàn)象或許正在成為法律計(jì)算的一種新方向。另一方面,有了成熟的計(jì)算方法,還需要具備豐富的法律數(shù)據(jù)來源。可是計(jì)算的法律數(shù)據(jù)則誕生于法律的實(shí)踐,靜態(tài)的法律條文既不可能反映數(shù)量變化情況,更無法自我呈現(xiàn)法律條文背后復(fù)雜的權(quán)力關(guān)系,因此,動(dòng)態(tài)變化的法律實(shí)踐才是法律量化數(shù)據(jù)的重要源泉。下文將從可以計(jì)算的法律量化數(shù)據(jù)特征與計(jì)算法學(xué)如何使用機(jī)器學(xué)習(xí)方法兩個(gè)方面展開分析。
?。ㄒ唬┯?jì)算法律的方法
計(jì)算法學(xué)的基本方式是什么?這是一個(gè)十分重要但尚未厘清的問題。筆者以為,以統(tǒng)計(jì)學(xué)為根基的機(jī)器學(xué)習(xí)應(yīng)成為法律計(jì)算的主要方式。在美國,已經(jīng)有學(xué)者開始探索、使用機(jī)器學(xué)習(xí)相關(guān)方法研究法律問題。如美國學(xué)者喬恩·克萊因伯格(Jon Kleinberg)等人以此分析了美國15萬余件重罪案件的法官假釋結(jié)果,他們對法律的計(jì)算思路與方法值得關(guān)注,可據(jù)此從計(jì)算法律的設(shè)計(jì)思路,法律決策樹與隨機(jī)森林的組成以及梯度提升算法的應(yīng)用方面把握計(jì)算法律的方式。
首先,使用機(jī)器學(xué)習(xí)的法律計(jì)算是以概率論、數(shù)理統(tǒng)計(jì)、最優(yōu)化理論等為基礎(chǔ),核心要素是法律數(shù)據(jù)的計(jì)算模型。機(jī)器學(xué)習(xí)的結(jié)果與統(tǒng)計(jì)學(xué)的相關(guān)性分析類似,都是一種法律數(shù)據(jù)擬合度很高的計(jì)算模型,可以實(shí)現(xiàn)通過機(jī)器學(xué)習(xí)方法對法律結(jié)果的預(yù)測。如喬恩·克萊因伯格等人利用美國司法部(1990年至2009年)審前保釋決定的相關(guān)數(shù)據(jù),并將其分為法官?zèng)Q定組與機(jī)器學(xué)習(xí)預(yù)測組,對影響釋放決定的因素,如再犯風(fēng)險(xiǎn)、逃避審判風(fēng)險(xiǎn)、保釋金數(shù)額等決定性要素量化處理。通過決策樹、梯度提升算法等機(jī)器學(xué)習(xí)方法構(gòu)建和訓(xùn)練計(jì)算模型,使用梯度算法提高計(jì)算模型的精確性,通過對比法官?zèng)Q策結(jié)果與機(jī)器學(xué)習(xí)算法預(yù)測結(jié)果的差異,分析影響差異產(chǎn)生的“不具有觀察性”的要素。
其次,利用法律經(jīng)驗(yàn)數(shù)據(jù)的特征與法律決策分類結(jié)果之間的數(shù)量關(guān)系建構(gòu)出具有分類關(guān)系的決策樹,即讓不同法律關(guān)系特征落入對應(yīng)分類的模型。為避免單一法律特征可能被過度放大,造成不必要的偏差,其隨機(jī)挑選部分法律數(shù)據(jù)特征建構(gòu)多棵決策樹形成隨機(jī)森林。決策樹與隨機(jī)森林是常用的機(jī)器學(xué)習(xí)分類方法,在法律樣本數(shù)據(jù)中,依據(jù)結(jié)果變量與自變量之間的對應(yīng)關(guān)系可以構(gòu)建多棵決策樹組成隨機(jī)森林。如再犯風(fēng)險(xiǎn)、逃避審判可能和保釋金額同審前釋放決定之間的對應(yīng)關(guān)系即可構(gòu)成不同類別的決策樹。獲得一種對同類數(shù)據(jù)相同方法處理的“學(xué)習(xí)分類器”,使得新出現(xiàn)的案例數(shù)據(jù)對應(yīng)預(yù)測分類。例如,在喬恩·克萊因伯格等人的研究中使用決策樹對釋放風(fēng)險(xiǎn)予以評估,將觀察因素(影響決定的因素)映射到結(jié)果(逃避審判風(fēng)險(xiǎn))的函數(shù),建立一系列“二元決策樹”。如決策樹根據(jù)先前是否有犯罪記錄進(jìn)行第一次分叉,直至沒有辦法再找到新的屬性來進(jìn)行節(jié)點(diǎn)分割時(shí)分叉停止,每個(gè)葉節(jié)點(diǎn)都形成對應(yīng)的結(jié)果。上述方法將審前釋放決定與各類影響因素之間構(gòu)成不同的決策樹,并使用由決策樹構(gòu)成的“預(yù)測模型”實(shí)現(xiàn)對同類問題的分類預(yù)測,使得機(jī)器學(xué)習(xí)具備初步的結(jié)果分類預(yù)測功能。
再次,使用梯度算法提升模型預(yù)測結(jié)果的精確性,對比預(yù)測結(jié)果與法官?zèng)Q定的差異,分析影響人類法官?zèng)Q策的潛在因素。如若構(gòu)建出多個(gè)決策樹模型,讓重要的法律關(guān)系在法律決策的結(jié)果中占有更重要的比重,從而形成精確度更高的決策樹,需要使用梯度提升法。利用梯度提升方法將法律數(shù)據(jù)進(jìn)行迭代,在決策樹的特定分叉中結(jié)合深度學(xué)習(xí)方法應(yīng)用損失函數(shù),減少偏差和方差來提升預(yù)測結(jié)果的精確性。不僅如此,還會(huì)不斷使用估計(jì)與評估的相關(guān)算法,避免因使用相同數(shù)集造成過度擬合與標(biāo)簽缺失問題,確保訓(xùn)練樹(輸入值)的數(shù)據(jù)與評估樹的數(shù)據(jù)之間沒有缺漏。如在美國法官的審前釋放決定中,被告人是否出庭相比被告人是否具有前科,對于評估逃避審判責(zé)任的風(fēng)險(xiǎn)可能就是一組更為重要的關(guān)系。將機(jī)器學(xué)習(xí)的輸出結(jié)果與現(xiàn)實(shí)答案(法官釋放結(jié)果)代入損失函數(shù),可以對比出人類法官?zèng)Q策與機(jī)器學(xué)習(xí)預(yù)測之間的差異。此外,在處理選擇性標(biāo)簽與潛在混淆因素問題之后,機(jī)器學(xué)習(xí)預(yù)測的釋放結(jié)果與法官釋放結(jié)果的差異化因素即會(huì)被捕獲。喬恩·克萊因伯格等人的研究即發(fā)現(xiàn):“相比機(jī)器學(xué)習(xí)算法,人類法官?zèng)Q策似乎釋放了一些高犯罪率的人群。這似乎表明人類法官可能錯(cuò)誤預(yù)判了部分被告人的釋放風(fēng)險(xiǎn)或者考慮過其它不具備觀察條件的影響因素?!苯Y(jié)合這類差異,進(jìn)一步發(fā)現(xiàn),法官不當(dāng)運(yùn)用“不具有觀察性”因素對釋放風(fēng)險(xiǎn)進(jìn)行了不當(dāng)評估。如被告是否出庭或庭上舉止等因素,使得法官假釋決定可能存在尚未被發(fā)現(xiàn)的系統(tǒng)性偏差,使用機(jī)器學(xué)習(xí)方法得出的解釋決定反而可能有助于減少監(jiān)禁率與犯罪率。
分析域外文獻(xiàn)中使用機(jī)器學(xué)習(xí)方法計(jì)算法律過程旨在說明,決策樹、隨機(jī)森林、梯度提升算法等機(jī)器學(xué)習(xí)方法已在相關(guān)法律實(shí)證研究與計(jì)算法學(xué)中廣泛應(yīng)用,機(jī)器學(xué)習(xí)的法律計(jì)算具備相當(dāng)?shù)膶?shí)際應(yīng)用價(jià)值。如蘇爾登(Surden)等人的專題文章詳盡介紹機(jī)器學(xué)習(xí)算法在法律實(shí)證研究中的實(shí)踐應(yīng)用,張永健等人使用聚類算法等機(jī)器學(xué)習(xí)方法分析法律淵源的分類,李本(Benjamin Liebma)等人應(yīng)用深度學(xué)習(xí)方法分析中國法官規(guī)避司法責(zé)任的規(guī)律性特征,等等皆是如此??梢哉f,計(jì)算法學(xué)(實(shí)證研究的機(jī)器學(xué)習(xí)版)的核心方法即是通過收集真實(shí)、客觀的法律運(yùn)行數(shù)據(jù),使用logistic回歸、相關(guān)性分析等統(tǒng)計(jì)學(xué)方法,結(jié)合決策樹、隨機(jī)森林、梯度提升算法、聚類算法等典型的機(jī)器學(xué)習(xí)方法對法律實(shí)踐與法學(xué)現(xiàn)象展開研究或進(jìn)行觀察,并總結(jié)、歸納法律運(yùn)行規(guī)律。這些研究方法便是當(dāng)下域外相當(dāng)成功的實(shí)證研究與計(jì)算法律的最新方式,值得我們觀察、借鑒與嘗試運(yùn)用。
?。ǘ┛晒┯?jì)算的法律數(shù)據(jù)特征
當(dāng)然,擁有了成熟的計(jì)算方法以后,法律的計(jì)算還需要有大量符合計(jì)算要求的法律數(shù)據(jù)。首先,可以計(jì)算的法律是公開化而非半公開化的法律數(shù)據(jù)。理想的、可計(jì)算的法律數(shù)據(jù)要全景式展現(xiàn)法律規(guī)律(現(xiàn)象)產(chǎn)生、發(fā)展及其運(yùn)作結(jié)果的全過程。實(shí)際上,公開化、完全理想的法律數(shù)據(jù)并不太多。我國裁判文書網(wǎng)公布的裁判文書是可公開獲取的法律數(shù)據(jù),但公開的僅僅是裁判結(jié)果與清單式的證據(jù)材料,而沒有公開裁判形成過程的相關(guān)信息。例如,審判委員會(huì)的決策可能對裁判結(jié)果產(chǎn)生實(shí)質(zhì)性影響,但是此類信息往往又不會(huì)被裁判文書所完整記載。又如可以影響量刑的法官的價(jià)值取向,主觀偏好、司法潛見等因素似乎也未充分公開。此外,大量案外(如社會(huì)結(jié)構(gòu)、經(jīng)濟(jì)水平和環(huán)境等)因素對司法裁判的影響程度,也未以法律數(shù)據(jù)的形式量化。因此,可以被外界計(jì)算的法律數(shù)據(jù)往往是已被數(shù)據(jù)記錄的、公開化的法律經(jīng)驗(yàn)(現(xiàn)象)數(shù)據(jù),而非尚未被收集的法律數(shù)據(jù),當(dāng)前可以計(jì)算的法律也往往處于法律規(guī)范、法律實(shí)踐的內(nèi)部。
其次,可以計(jì)算的法律是一種具備普遍性、共通性以及類型化特征的法律量化數(shù)據(jù)。計(jì)算法律的前提是將法律經(jīng)驗(yàn)、法律規(guī)律從法律的文本語言轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別的數(shù)字,其過程實(shí)際上就是法律信息的模式識(shí)別,需要對法律信息進(jìn)行劃分和歸類處理。目前運(yùn)用較多的方法是“自然語義挖掘”技術(shù)。通過這種技術(shù)可以使得外在表述不同,但內(nèi)涵相對一致的法律文本語言劃分為相同或者相似的類別。換言之,可以計(jì)算的法律經(jīng)驗(yàn)數(shù)據(jù)需要具備一定的類型化特征,具備模式化識(shí)別的條件。極為罕見的法律現(xiàn)象、法律經(jīng)驗(yàn)往往可能無法形成有規(guī)模的類型化法律數(shù)據(jù),并且概括的分類必然會(huì)失去或忽略那些可能相關(guān)的特征。這可能減損數(shù)據(jù)本身所蘊(yùn)含的信息量。在樣本的數(shù)據(jù)量不足或數(shù)據(jù)失真的情況下,即便存在好的計(jì)算方法,也難以產(chǎn)生可靠的計(jì)算結(jié)果。
此外,基于法律人法律推理和思維判斷所獲取的主觀性法律經(jīng)驗(yàn)或法律感受往往無法進(jìn)行類型化處理,更難以客觀量化。例如,“排除合理懷疑”作為刑事證明標(biāo)準(zhǔn),往往是法官自由心證之結(jié)果,具有一定法律推理及其主觀經(jīng)驗(yàn)累積判斷的特征,而“合理懷疑”的內(nèi)涵來源又具有豐富的神學(xué)、宗教色彩。所以,“排除合理懷疑”很難通過數(shù)字指標(biāo)予以類型化分析和量化,更不是具備量化特征的法律關(guān)系。
再次,可計(jì)算的法律還應(yīng)當(dāng)具備相對確定的數(shù)量關(guān)系特征。建構(gòu)量刑模型即是一種典型的應(yīng)用。刑罰中的刑期作為統(tǒng)計(jì)學(xué)意義上的連續(xù)變量,往往受到犯罪動(dòng)機(jī)、犯罪手段以及認(rèn)罪態(tài)度等因素的影響,前述量刑情節(jié)本身又屬于統(tǒng)計(jì)學(xué)意義上的定性變量。通過分析若干量刑情節(jié)的定性變量對量刑幅度的影響,可以發(fā)現(xiàn)各類量刑情節(jié)對刑期影響程度的大小,進(jìn)而得出量刑實(shí)踐的規(guī)律性特征。換言之,量刑幅度與量刑情節(jié)是具備數(shù)量變化特征的法律關(guān)系,特別在最高法院積極推動(dòng)的量刑規(guī)范化改革影響下,我國量刑程序公開化、透明化程度已經(jīng)取得長足進(jìn)步,由相對確定的法定刑與法官自由裁量權(quán)共同構(gòu)成的量刑程序構(gòu)造,更有利于排除非法律因素的干擾,使量刑結(jié)果與量刑情節(jié)之間的數(shù)量關(guān)系特征更為明顯。不過,如果一項(xiàng)判決就是規(guī)則與事實(shí)相結(jié)合的產(chǎn)物,司法人員的工作模式便宛如數(shù)學(xué)公式的計(jì)算,這屬于非常理想化的法律計(jì)算過程。實(shí)際上,有研究表明:“只有在尋求的目標(biāo)很簡單、有清晰的定義和可以測量的情況下,效率公式、生產(chǎn)函數(shù)和理性行動(dòng)才能被具體指明。”然而,不少法律語言都存在模糊不清的“半影地帶”。尤其是我國定罪量刑所依據(jù)的法律條文可能因法律語言的融合和變遷形成語言的復(fù)雜、多元性變化。即使相同的法律條文,在具體適用的場合往往可能產(chǎn)生不同的理解,使用不同的法律解釋方法也可能產(chǎn)生截然相反的結(jié)果。例如,法律條文中的“認(rèn)罪態(tài)度良好”“犯罪情節(jié)極其惡劣”“手段極其殘忍”等內(nèi)容,雖然文本表述明確,但是相同文字表述可以含有相當(dāng)豐富和多元的內(nèi)容,可能影響數(shù)據(jù)量化的精準(zhǔn)性。因此,量刑幅度與量刑情節(jié)這類相對確定的數(shù)量變化關(guān)系,因相關(guān)量刑情節(jié)在法律概念、法律語言方面的模糊性,也只能得出大致的量刑范圍,而不能得出具體的精確計(jì)算結(jié)果。法律計(jì)算還不能如“自動(dòng)售貨機(jī)”那般輸入案情與法條便得出判決的結(jié)果。
最后,計(jì)算法學(xué)所計(jì)算的是具有一定數(shù)據(jù)質(zhì)量要求的全樣本大數(shù)據(jù)或大量數(shù)據(jù),這與傳統(tǒng)實(shí)證研究有所差異。傳統(tǒng)實(shí)證研究所處理的數(shù)據(jù)在代表性方面可能更好,但在數(shù)量與質(zhì)量方面不如計(jì)算法學(xué)所處理的數(shù)據(jù)。不過,兩者之間并沒有一個(gè)非此即彼的區(qū)分。實(shí)際上,傳統(tǒng)法律實(shí)證研究往往也能夠處理較大數(shù)量的有代表性的數(shù)據(jù),但完美的全樣本大數(shù)據(jù)在法律計(jì)算時(shí)并不多見,因而計(jì)算法律的實(shí)踐或許還會(huì)遭遇一定的數(shù)據(jù)質(zhì)量難題。
三、前路漫漫:計(jì)算法學(xué)的春天會(huì)到來嗎?
計(jì)算法學(xué)的出現(xiàn)使得學(xué)界甚至資本都摩拳擦掌,一時(shí)間“計(jì)算法學(xué)”變得炙手可熱,冠以“計(jì)算法學(xué)研究”“計(jì)算法學(xué)方法”“計(jì)算法學(xué)技術(shù)”的成果開始涌現(xiàn)。在筆者看來,此種熱鬧繁榮的景象并非意味著計(jì)算法學(xué)即將步入正軌。恰好相反,計(jì)算法學(xué)還需經(jīng)歷漫長的實(shí)踐探索。雖然機(jī)器學(xué)習(xí)已經(jīng)應(yīng)用于法律計(jì)算和法律實(shí)證研究,機(jī)器學(xué)習(xí)對法律的計(jì)算效果或許具有積極意義,但是也存在一定的局限性。從積極層面而言,使用機(jī)器學(xué)習(xí)方法對法律經(jīng)驗(yàn)數(shù)據(jù)的分析,可以獲得一種數(shù)據(jù)擬合性較高的回歸分析結(jié)果,能夠客觀揭示復(fù)雜法律實(shí)踐之間所蘊(yùn)含的法律運(yùn)行規(guī)律,從而改變了傳統(tǒng)依據(jù)主觀先驗(yàn)式經(jīng)驗(yàn),通過法律邏輯推理并且創(chuàng)造法學(xué)理論的傳統(tǒng)法學(xué)知識(shí)生產(chǎn)方式。這有助于我們發(fā)現(xiàn)立法與實(shí)踐的悖反之處,將法律中的模糊表達(dá)量化為具有客觀參考價(jià)值的法律數(shù)據(jù)。此外,這種方法還可以揭示從前我們可能無從獲知的某些法律實(shí)踐之間存在事實(shí)上的相關(guān)性與關(guān)聯(lián)程度,并且在條件相同的情形下,機(jī)器學(xué)習(xí)算法將始終給出相同的答案,從而能夠減少法律系統(tǒng)內(nèi)部所存在的主觀盲目性,遏制法官因行使自由裁量權(quán)導(dǎo)致的錯(cuò)誤。
然而,機(jī)器學(xué)習(xí)對法律的計(jì)算并不是一種“全方位、無死角”的計(jì)算,使用機(jī)器學(xué)習(xí)的法律計(jì)算存在兩方面的局限性。一方面,機(jī)器學(xué)習(xí)的法律計(jì)算僅僅是一種依托歷史數(shù)據(jù)的“預(yù)測”,僅能發(fā)現(xiàn)法律世界的“相關(guān)性”,難以解釋法律世界中的“因果律”。使用機(jī)器學(xué)習(xí)方法對法律結(jié)果的“預(yù)測”,其作用主要是發(fā)現(xiàn)各類影響因子、作用因素與法律實(shí)踐現(xiàn)象之間的相關(guān)性。當(dāng)然,法官的司法決策過程涉及大前提(法律規(guī)則)、小前提(法律事實(shí))和法律結(jié)果的“三段論”推理過程,此類決策推理是一種“反事實(shí)推理”的過程。即便是法律數(shù)據(jù)擬合度很高的機(jī)器學(xué)習(xí)“模型訓(xùn)練”也僅是一種相關(guān)性分析,對于需要“反事實(shí)推理”得出法律的因果推斷過程,機(jī)器學(xué)習(xí)方法尚處于“知其然,而不知其所以然”的階段。單純的機(jī)器學(xué)習(xí)方法本身可能難以直接發(fā)現(xiàn)因果關(guān)系,揭示現(xiàn)象背后更深層次法律實(shí)踐之“因果律”。
另一方面,機(jī)器學(xué)習(xí)的法律計(jì)算難以充分把握、模擬人類的思維和意識(shí)。法律人的決策推理過程、決策結(jié)果往往與機(jī)器學(xué)習(xí)的法律現(xiàn)象預(yù)測具有明顯差異,這在復(fù)雜案件中更是如此。有研究就指出,“人類區(qū)別于其它靈長類動(dòng)物的典型特征即是擁有意識(shí)”。由“硅元素”組成的計(jì)算機(jī)能否如同由“碳基”組成的人類那般擁有意識(shí),像人類那樣思考?這一直是人工智能界與哲學(xué)界爭議不休的話題。計(jì)算機(jī)技術(shù)的先驅(qū)阿蘭·麥席森·圖靈在進(jìn)行“圖靈測試”時(shí),也有意或無意地回避機(jī)器是否具備意識(shí)的問題。姑且不論前述爭議的結(jié)局如何,法律人的思維推理模式與機(jī)器學(xué)習(xí)的計(jì)算之間始終存在“隔閡”,而這些不同是人類的自然基礎(chǔ)不同于機(jī)器所決定的。如法律人決策與推理的過程往往涉及無罪推定、排除合理懷疑、內(nèi)心確信等帶有人類主觀評價(jià)色彩的復(fù)雜概念,許多無法量化輸入、客觀認(rèn)知的法律知識(shí),恐怕難以被尚不具備人類思考和意識(shí)的計(jì)算機(jī)理解。即便理論上使用“強(qiáng)化學(xué)習(xí)”的方法可應(yīng)對沒有歷史數(shù)據(jù)輸入的學(xué)習(xí)場景,但是此類學(xué)習(xí)方法還處于“有多少人工,方有多少智能”的尷尬局面。因此,它自然就難以勝任對主觀性法律概念的理解和把握。
實(shí)際上,感知領(lǐng)域才是機(jī)器學(xué)習(xí)與人工智能技術(shù)主要突破的方向,圖像識(shí)別、語音轉(zhuǎn)化是人工智能技術(shù)的主要應(yīng)用場景,如人臉識(shí)別技術(shù)、自動(dòng)駕駛、棋類(AlphaGo)游戲是其主要應(yīng)用成果。這在相當(dāng)程度上是一種基于歷史經(jīng)驗(yàn)數(shù)據(jù)、對客觀物體的感知技術(shù)。相比機(jī)器學(xué)習(xí)面對單一客觀關(guān)系的“預(yù)測”結(jié)果,法律人決策面對的更多是未來不確定性的主觀性法律關(guān)系,復(fù)雜的人類法律決策夾雜人類常識(shí)、情感與主觀價(jià)值判斷等因素,機(jī)器學(xué)習(xí)等人工智能技術(shù)是—種“站在第三人”視角觀察現(xiàn)象、總結(jié)規(guī)律、建立理論的方法,實(shí)際上難以模仿和學(xué)習(xí)人類常識(shí)和主觀性認(rèn)知,更不擅長模擬法律人的決策與內(nèi)心推理過程,至少在復(fù)雜案件中難以模擬、超越人的決策機(jī)制的效果。相比人類意識(shí)和人類大腦所具備的“自監(jiān)督學(xué)習(xí)”機(jī)制,機(jī)器學(xué)習(xí)方法在法律的預(yù)測能力、學(xué)習(xí)效率、成本收益方面不盡如人意。目前,最先進(jìn)的人工智能系統(tǒng)可能還不如一只貓聰明,貓的大腦有大約7.6億個(gè)神經(jīng)元和1萬億個(gè)突觸,人腦則具有860億個(gè)神經(jīng)元但功耗僅為25瓦。人腦的計(jì)算量大約是每秒可執(zhí)行1.5×1018次計(jì)算,現(xiàn)在一塊GPU每秒可執(zhí)行1013次計(jì)算,功耗約為250瓦。為了達(dá)到人腦的計(jì)算能力,必須將10萬處理器鏈接并且至少消耗25兆瓦的巨型計(jì)算機(jī)才能實(shí)現(xiàn)。前述能耗是人腦消耗的100萬倍。即便未來機(jī)器的處理能力變得同人類一般強(qiáng)大,但是機(jī)器是否也具備人類基于生理的共情能力仍然未知。況且,法律人的決策過程實(shí)際上是對未來不確定性法律關(guān)系的評判,而非簡單基于已知法律數(shù)據(jù)的“預(yù)測”,這其中的差異也決定了機(jī)器學(xué)習(xí)方法與當(dāng)前開發(fā)出的人工智能技術(shù)并不擅長模擬人類常識(shí)和邏輯推理過程??傊?,計(jì)算機(jī)難以深度介入與模仿法律人的決策。
面對法律計(jì)算的上述局限,尚處于學(xué)科凝練與基礎(chǔ)建構(gòu)階段的計(jì)算法學(xué),需要在未來理清學(xué)科發(fā)展脈絡(luò),突破發(fā)展進(jìn)程中的困難與瓶頸。
第一,結(jié)合我國法律數(shù)據(jù)的“本土資源”,探索可行的法律計(jì)算思路與機(jī)器學(xué)習(xí)方法。當(dāng)前,我國裁判文書、檢察文書的公開已初具規(guī)模,各類司法文書的電子化與法律運(yùn)作過程的數(shù)據(jù)化正在成為現(xiàn)實(shí)。但是,可公開獲取裁判文書所呈現(xiàn)的內(nèi)容往往只是法官自由心證的結(jié)果及其支撐裁判結(jié)果的材料及理由。這類數(shù)據(jù)可能已受到人類選擇性認(rèn)知的影響,難以全面展現(xiàn)裁判結(jié)果形成的完整過程與全部考量因素。真實(shí)法律世界的某些部分包括重要而“隱秘”的部分是可獲得的法律數(shù)據(jù)尚未充分反映的。即便是從司法機(jī)關(guān)內(nèi)部獲取的法律數(shù)據(jù),因其數(shù)據(jù)本身主要滿足訴訟管理之需要,還不能完全呈現(xiàn)司法實(shí)踐的全貌,更難以充分滿足精確計(jì)算法律的需要??偟膩碚f,我國所公開的司法數(shù)據(jù)大多是一種結(jié)果性材料,對于研究一些諸如司法人員推理、決策等過程性問題的作用相當(dāng)有限。據(jù)此,計(jì)算法學(xué)的未來發(fā)展,一方面需要吸收、借鑒域外實(shí)證研究中既有的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等計(jì)算機(jī)技術(shù)與方法,結(jié)合本土法律數(shù)據(jù),探索有效的法律計(jì)算思路與機(jī)器學(xué)習(xí)方法,促進(jìn)中國計(jì)算法學(xué)的落地實(shí)施;另一方面,需要不斷擴(kuò)寬法律數(shù)據(jù)的來源渠道,客觀記錄司法實(shí)踐的運(yùn)行過程,保障法律數(shù)據(jù)來源渠道、形成過程與經(jīng)驗(yàn)現(xiàn)象產(chǎn)生的真實(shí)性,為計(jì)算法學(xué)的繁榮奠定數(shù)據(jù)基礎(chǔ)。
第二,計(jì)算法學(xué)應(yīng)致力在更多問題、更廣闊領(lǐng)域內(nèi),探索、應(yīng)用機(jī)器學(xué)習(xí),并與傳統(tǒng)法律實(shí)證研究以及其他研究方法共同揭示法律實(shí)踐規(guī)律與匡正法學(xué)理論。作為法律實(shí)證研究的衍生和拓展,計(jì)算法學(xué)同樣以法律實(shí)踐的經(jīng)驗(yàn)現(xiàn)象作為理論關(guān)切點(diǎn),通過收集、整理、分析和應(yīng)用數(shù)據(jù),嘗試使用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)的相關(guān)知識(shí)進(jìn)行相關(guān)研究。計(jì)算法學(xué)運(yùn)用機(jī)器學(xué)習(xí)方法進(jìn)行法律結(jié)果“預(yù)測”,是一種數(shù)據(jù)擬合程度較高的相關(guān)性分析,在相當(dāng)程度上也是統(tǒng)計(jì)學(xué)知識(shí)與方法的實(shí)踐應(yīng)用。相比傳統(tǒng)的法律實(shí)證研究,充分使用機(jī)器學(xué)習(xí)方法的計(jì)算法學(xué)或者說“未來版的實(shí)證研究”將倡導(dǎo)使用決策樹、隨機(jī)森林、梯度提升算法、神經(jīng)網(wǎng)絡(luò)架構(gòu)等機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法來分析法律關(guān)系,從而更有利于在大量散亂分布的法律數(shù)據(jù)中發(fā)現(xiàn)零散數(shù)據(jù)之間的相關(guān)性與關(guān)聯(lián)程度,最終發(fā)現(xiàn)司法實(shí)踐或法律事件的發(fā)展或運(yùn)行規(guī)律。同時(shí),為了彌補(bǔ)機(jī)器學(xué)習(xí)方法在“因果推斷”領(lǐng)域的缺憾,歸納法律現(xiàn)象背后的內(nèi)在規(guī)律與成因,還需要?jiǎng)?chuàng)新傳統(tǒng)的實(shí)證研究方法,這主要是使用諸如隨機(jī)實(shí)驗(yàn)、斷點(diǎn)回歸、雙重差分、工具變量等方法,在實(shí)驗(yàn)室條件下或者隨機(jī)田野試驗(yàn)的條件下不斷探索法律規(guī)范、法律政策與法律實(shí)踐之間的“因果律”。如2021年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主書亞·安格里斯特(Joshua D Angrist)和吉多·因本斯(Guido W Imbens)的貢獻(xiàn)即在于對因果關(guān)系分析方法的創(chuàng)新,即使用“自然實(shí)驗(yàn)”來模仿隨機(jī)控制實(shí)驗(yàn),評估反事實(shí)結(jié)果從而推斷經(jīng)濟(jì)變量之間的因果關(guān)系。2019年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)阿比吉特·班納吉(Abhijit V. Banerjee )、埃斯特·迪弗洛(Esther Duflo )、邁克爾·克雷默(Michael Kremer)在“減輕全球貧困方面的實(shí)驗(yàn)性方法”作出了杰出貢獻(xiàn),發(fā)現(xiàn)了全球貧困原理以及各種扶貧政策的因果效用。前述方法對于判斷法律規(guī)范與實(shí)踐之間的因果關(guān)系具有啟發(fā)和借鑒意義。因此,未來實(shí)證研究還應(yīng)持續(xù)探索隨機(jī)試驗(yàn)、雙重差分、工具變量等統(tǒng)計(jì)學(xué)的因果推斷方法,從而形成各類揭示“因果關(guān)系”的成熟方法。
當(dāng)然,計(jì)算法學(xué)雖然是法律實(shí)證研究的最新范式轉(zhuǎn)型,但不是唯一的創(chuàng)新方式,其范式“轉(zhuǎn)型”也不意味著研究方法的替代。計(jì)算法學(xué)的發(fā)展繞不開法律實(shí)證研究方法的推廣,更無法取代法律實(shí)證研究的知識(shí)貢獻(xiàn)。即便是一種在原有方法上的部分創(chuàng)新也不應(yīng)該直接否定或摒棄原有方法的知識(shí)貢獻(xiàn),否則極易陷入研究方法上的“獨(dú)斷論”錯(cuò)誤。事實(shí)上,機(jī)器學(xué)習(xí)方法的主要原理依然是統(tǒng)計(jì)學(xué)領(lǐng)域內(nèi)相關(guān)性分析的數(shù)學(xué)知識(shí)。對于需要發(fā)現(xiàn)法學(xué)理論“因果律”的領(lǐng)域,通過法律文本的法教義學(xué)研究仍然是未來法學(xué)理論建構(gòu)的重要源泉,結(jié)合司法實(shí)踐的法律實(shí)證研究與社科法學(xué)研究在揭示法律實(shí)踐規(guī)律方面也依然占有一席之地。尤其是傳統(tǒng)實(shí)證研究通過對統(tǒng)計(jì)學(xué)方法的創(chuàng)新應(yīng)用,在因果推斷等方面也可以做出創(chuàng)新性研究,其價(jià)值與意義不亞于甚至可能高于不少計(jì)算法學(xué)的成果??梢哉f,法教義學(xué)、社科法學(xué)與法律實(shí)證研究(包括計(jì)算法學(xué))的方法在學(xué)術(shù)志趣、研究對象與實(shí)現(xiàn)路徑方面盡管存在差別,但是它們都各自具備著獨(dú)特的方法論價(jià)值,相互之間彼此共生,共同促進(jìn)法學(xué)研究的繁榮。使用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)方法的計(jì)算法學(xué)也應(yīng)當(dāng)結(jié)合現(xiàn)有法律實(shí)證研究等方法,共同揭示法律實(shí)踐之間的關(guān)聯(lián)性與因果律,客觀把握法律實(shí)踐規(guī)律,探索出一種補(bǔ)充、修正法學(xué)理論的新模式。計(jì)算法學(xué)與法律大數(shù)據(jù)的到來從未叫囂“理論已死”,而只是可能“從根本上改變了我們理解世界的方式”。
換言之,使用機(jī)器學(xué)習(xí)方法的計(jì)算法學(xué)出現(xiàn)或許將會(huì)為我們帶來觀察法律現(xiàn)象的全新方法,但是我們更應(yīng)理性看待其未來發(fā)展:既不能高估機(jī)器學(xué)習(xí)方法所帶來的法律預(yù)測能力,也不能低估不斷發(fā)展的統(tǒng)計(jì)學(xué)理論與方法在主流實(shí)證研究中的獨(dú)特魅力與價(jià)值,更不能忽視結(jié)合統(tǒng)計(jì)和計(jì)算的實(shí)證研究與機(jī)器學(xué)習(xí)在發(fā)現(xiàn)法律實(shí)踐規(guī)律方面的貢獻(xiàn)。無論如何,現(xiàn)階段我們需要更多地夯實(shí)法律研究的“計(jì)算能力”,正確認(rèn)識(shí)法律數(shù)據(jù)的欠缺性與機(jī)器學(xué)習(xí)法律計(jì)算的局限性,培養(yǎng)具備交叉學(xué)科背景的法律計(jì)算人才,摸索可應(yīng)用于中國法律數(shù)據(jù)的計(jì)算思路與計(jì)算方法,打造中國計(jì)算法學(xué)的“拳頭產(chǎn)品”。嘗試并推進(jìn)以實(shí)證研究方法為底色的計(jì)算法學(xué)學(xué)科建設(shè),促進(jìn)計(jì)算法學(xué)研究的落地生根,將是未來中國新型法律人的責(zé)任與使命。計(jì)算法學(xué)的春天已經(jīng)來臨了嗎?就讓未來告訴未來吧。
聯(lián)系客服