全文鏈接:http://tecdat.cn/?p=32794
近年來電子商務(wù)發(fā)展迅速,隨之而來的信用問題給消費(fèi)者帶來諸多困擾,造成電子商務(wù)網(wǎng)上各種交易問題產(chǎn)生的原因是多方面的,但總的來說是缺乏有效的信用評價體系(點(diǎn)擊文末“閱讀原文”獲取完整代碼數(shù)據(jù))。
相關(guān)視頻
目前各電子商務(wù)網(wǎng)站雖然都建立了信用評價體系,但是各網(wǎng)站提出的信用評價系統(tǒng)、流程以及指標(biāo)體系大體相同并已經(jīng)使用多年,并沒有根據(jù)電子商務(wù)的現(xiàn)實發(fā)展而進(jìn)行創(chuàng)新優(yōu)化,也沒有根據(jù)評價用戶實際需求進(jìn)行更精準(zhǔn)的設(shè)計。
本文以淘寶網(wǎng)為例,幫助客戶改進(jìn)了指標(biāo)體系,并通過模糊C均值聚類對賣家基于新的指標(biāo)體系進(jìn)行信用分類。
聚類算法是一種常用的數(shù)據(jù)分析和模式識別方法,用于將數(shù)據(jù)集劃分為若干個相似的子集,每個子集稱為一個簇。模糊聚類算法是一種基于模糊理論的聚類方法,具有較好的魯棒性和靈活性,因此在許多領(lǐng)域得到了廣泛的應(yīng)用。
模糊C均值聚類算法是最早和最常用的模糊聚類算法之一。該算法通過最小化目標(biāo)函數(shù)來確定數(shù)據(jù)集中每個樣本的隸屬度和聚類中心,從而實現(xiàn)聚類分析。然而,傳統(tǒng)的模糊C均值聚類算法存在收斂速度慢、對初始聚類中心敏感等問題。
為了克服傳統(tǒng)模糊C均值聚類算法的不足,研究者們提出了許多改進(jìn)的模糊聚類算法。例如,基于遺傳算法的模糊聚類算法、基于粒子群優(yōu)化的模糊聚類算法等。這些改進(jìn)算法在收斂速度、聚類效果等方面都有所提升。
除了在數(shù)據(jù)分析和模式識別領(lǐng)域,模糊聚類算法還被廣泛應(yīng)用于其他領(lǐng)域。例如,在圖像分割、模式識別、生物信息學(xué)等領(lǐng)域都有模糊聚類算法的應(yīng)用。這些應(yīng)用領(lǐng)域的研究為模糊聚類算法的發(fā)展提供了新的方向和挑戰(zhàn)。
圖描述了一個凝聚模糊聚類方法AGENES和一個分裂模糊聚類方法DIANA在一個包括五個對象的數(shù)據(jù)的集合{a,b,c,d,e}上的處理的過程。初始時,AGENES將每個樣本點(diǎn)自為一簇,之后這樣的簇依照某一種準(zhǔn)則逐漸合并,例如,例如簇C1中的某個樣本點(diǎn)和簇C2中的一個樣本點(diǎn)相隔的距離是所有不同類簇的樣本點(diǎn)間歐幾里得距離最近的,則認(rèn)為簇C1和簇C2是相似可合并的。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
SQL Server Analysis Services數(shù)據(jù)挖掘聚類分析職業(yè)、地區(qū)、餐飲消費(fèi)水平數(shù)據(jù)
左右滑動查看更多
01
02
03
04
C2C電子商務(wù)信用評價模型的基本原理是:確認(rèn)收貨之后,買方可以根據(jù)模型內(nèi)的評價指標(biāo),如商品質(zhì)量,物流速度,售后服務(wù)等方面,在一定時間內(nèi),根據(jù)自身交易完成情況為賣家評價,也可以雙方互評以形成信用記錄。交易雙方的信用反饋都會按模型設(shè)定的計算方式累計,以反映該用戶的信用狀況,以便其他交易方做選擇時參考。
目前淘寶網(wǎng)所采用的信用評價模型是累加模型,即原有的信用積分基礎(chǔ)上直接進(jìn)行加減,其模型表示如下:
其中:Rn、Rn-1分別表示淘寶用戶截止到第 n、n-1 次交易之后所獲得的信用得分,rn{-1,0,1}表示{差評,中評,好評},即當(dāng) rn獲得“差評”時在原來信用積分的基礎(chǔ)上加上“-1”分,用戶獲得中評時,就在原來信用積分的基礎(chǔ)上加“0”分,當(dāng)用戶獲得好評時,在原來信用積分的基礎(chǔ)上加“+1”分。累加模型能夠簡單直觀的展現(xiàn)交易雙方的信用積分,一定程度上可作為交易雙方的信用參考。
MATLAB是matrix&laboratory兩個詞的組合,意為矩陣工廠(矩陣實驗室)。是由美國mathworks公司發(fā)布的主要面對科學(xué)計算、可視化以及交互式程序設(shè)計的高科技計算環(huán)境。它將數(shù)值分析、矩陣計算、科學(xué)數(shù)據(jù)可視化以及非線性動態(tài)系統(tǒng)的建模和仿真等諸多強(qiáng)大功能集成在一個易于使用的視窗環(huán)境中,為科學(xué)研究、工程設(shè)計以及必須進(jìn)行有效數(shù)值計算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計語言(如C、Fortran)的編輯模式,代表了當(dāng)今國際科學(xué)計算軟件的先進(jìn)水平。
由于本文主要是基于 C2C 電子商務(wù)交易過程中的信用問題,從交易主體的角度來對 C2C 電子商務(wù)信用風(fēng)險進(jìn)行評價,目前淘寶網(wǎng)的信用評價指標(biāo)體系主要由三個指標(biāo)構(gòu)成,分別是:與圖片相符程度、服務(wù)態(tài)度以及發(fā)貨速度,如下圖所示:
而在實際網(wǎng)購過程中可以發(fā)現(xiàn)這三個指標(biāo)并不能讓消費(fèi)者對于物品的進(jìn)行準(zhǔn)確評價,消費(fèi)者往往需要額外進(jìn)行大片文字的敘述來評價商品以及服務(wù)。
故此,本文根據(jù)消費(fèi)者評論文字中經(jīng)常出現(xiàn)的關(guān)鍵詞新增了評價指標(biāo),選擇了商品屬性,賣家服務(wù)以及物流服務(wù)作為相應(yīng)準(zhǔn)則層,具體的指標(biāo)體系如下:
本文以日常生活使用較多的淘寶網(wǎng)為例,按照指標(biāo)體系中所列指標(biāo)進(jìn)行數(shù)據(jù)獲取,其中與圖片相符程度,服務(wù)態(tài)度以及發(fā)貨速度三個指標(biāo)在淘寶網(wǎng)上能夠直接獲取,其他指標(biāo)由于淘寶網(wǎng)上沒有直接數(shù)據(jù),故選擇了朋友購買過的淘寶服裝店鋪,針對其他指標(biāo)給出自己的評分,將所有指標(biāo)的評分原始數(shù)據(jù)匯總(查看文末了解數(shù)據(jù)免費(fèi)獲取方式),計算平均值,所得數(shù)據(jù)匯總?cè)缦拢?/p>
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
左右滑動查看更多
01
02
03
04
一次聚類算法是一種無監(jiān)督的層次聚類算法,需要事先給定層次聚類數(shù)C。
% 計算樣本點(diǎn)距離聚類中心的距離
% 輸入:
% center ---- 聚類中心
% data ---- 樣本點(diǎn)
% 輸出:
% out ---- 距離
out = zeros(size(center, 1), size(data, 1));
for k = 1:size(center, 1), % 對每一個聚類中心
f = U.^expo; % 隸屬度矩陣進(jìn)行指數(shù)運(yùn)算結(jié)果
dist = distfcm(center, data); % 計算距離矩陣
%將options 中的分量分別賦值給四個變量;
expo = options(1); % 隸屬度矩陣U的指數(shù)
max_iter = options(2); % 最大迭代次數(shù)
min_impro = options(3); % 隸屬度最小變化量,迭代終止條件
display = options(4); % 每次迭代是否輸出信息標(biāo)志
objfcn = zeros(max_iter, 1); % 初始化輸出參數(shù)obj_fcn
由于數(shù)據(jù)集各指標(biāo)值的量綱相同,因此不需要對相關(guān)指標(biāo)值進(jìn)行標(biāo)準(zhǔn)化處理,得到如圖所示的結(jié)果
相應(yīng)的聚類圖如圖所示:
plot(data(:,1), data(:,2),'o');
hold on;
maxU = max(U);
index1 = find(U(1,:) == maxU);
index2 = find(U(2,:) == maxU);
line(data(index1,1),data(index1,2),'marker','*','color','g');
line(data(index2,1),data(index2,2),'marker','*','color','r');
plot([center([1 2],1)],[center([1 2],2)],'*','color','k')
對于現(xiàn)有指標(biāo)體系,增加了新的指標(biāo)如:售后服務(wù),送貨速度,包裝完整度等,使得指標(biāo)體系更完全,通過淘寶賣家的指標(biāo)數(shù)據(jù)的處理,得出最終的信用綜合評分,由排名可以看見第四家得分最高,而第四家由于其商品質(zhì)量高,價格卻很便宜,在服務(wù)態(tài)度以及物流服務(wù)方面都深得買家的喜歡,排名最低的第一家買家其銷量非常高,但是由于商品質(zhì)量不過關(guān),使得商品的質(zhì)量與其價格不對稱,而且賣家售后服務(wù)態(tài)度惡劣,由此可以看出淘寶現(xiàn)有的信用評價體系能夠給買家提供一定的參考,但是如果能夠增加一些指標(biāo),將會對買家起到更好的參考作用。
本文總結(jié)了簡單介紹了層次聚類算法國內(nèi)外研究現(xiàn)狀,重點(diǎn)介紹了層次聚類算法的基本原理與實現(xiàn)流程。同時,針對 C2C 電子商務(wù)中所出現(xiàn)的信用風(fēng)險問題,提出使用信用評價體系來降低信用風(fēng)險。并簡述了國內(nèi)外在信用評價方面的研究現(xiàn)狀?;诂F(xiàn)有的評價指標(biāo)體系,添加新指標(biāo),給出了更為全面完善的指標(biāo)體系。以淘寶網(wǎng)為例,采集數(shù)據(jù),應(yīng)用層次聚類對店鋪進(jìn)行聚類分析。對比最終結(jié)果和實際購買體驗,證明了淘寶現(xiàn)有信用評價模型對于消費(fèi)者選擇賣家時有一定的指導(dǎo)意義,但是體系有明顯提升空間。
[1] Pang-Ning Tan Michael Steinbach Vipin Kumar著.范明,范宏建等譯.數(shù)據(jù)挖掘?qū)д揫M].北京:人民郵電出版社,2006.
[2]J.Han,M.Kamber著.范明,孟小峰等譯.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2001:1~262.
[3] 張鑫.層次聚類算法的研究與應(yīng)用[D]:[碩士學(xué)位論文].江西:江西理工大學(xué),2008.
[4] 段明秀.層次聚類算法的研究及應(yīng)用[D]:[碩士學(xué)位論文].長沙:中南大學(xué),2009.
[5] 楊海斌.一種新的層次聚類算法的研究及應(yīng)用[D]:[碩士學(xué)位論文].甘肅:西北師范大學(xué),2011.
[6] 馬曉艷,唐雁.層次聚類算法研究[J].計算機(jī)科學(xué),2008,34(7):34~36.
[7] 魏桂英,鄭玄軒.層次聚類方法的CURE算法研究[J].科技和產(chǎn)業(yè),2005,5(11):22~24.
[8] 蔣盛益,李霞.一種改進(jìn)的BIRCH聚類算法[J].計算機(jī)應(yīng)用,2009,29(1):293~296.
數(shù)據(jù)獲取
聯(lián)系客服