天天看點

資料挖掘與預測分析術語總結

資料挖掘目前在各類企業和機構中蓬勃發展。是以我們制作了一份此領域常見術語總結,希望你喜歡。

大資料(big data): 大資料既是一個被濫用的流行語,也是一個當今社會的真實趨勢。此術語指代總量與日俱增的資料,這些資料每天都在被捕獲、處理、彙集、儲存、分析。維基百科是這樣描述“大資料”的:“資料集的總和如此龐大複雜,以至于現有的資料庫管理工具難以處理(…)”。

流失分析(churn analysis/attrition analysis): 描述哪些顧客可能停止使用公司的産品/業務,以及識别哪些顧客的流失會帶來最大損失。流失分析的結果用于為可能要流失的顧客準備新的優惠。

聯合分析/權衡分析(conjoint analysis/ trade-off analysis): 在消費者實際使用的基礎上,比較同一産品/服務的幾個不同變種。它能預測産品/服務上市後的接受度,用于産品線管理、定價等活動。

信用評分(credit scoring): 評估一個實體(公司或個人)的信用值。銀行(借款人)以此判斷借款者是否會還款。

配套銷售/增值銷售(cross / up selling): 一個營銷概念。根據特定消費者的特征和過往行為,向其銷售補充商品(配套銷售)或附加商品(增值銷售)。

資料集市(data mart): 特定機構所儲存的,關于一個特定主題或部門的資料,如銷售、财務、營銷資料。

資料品質(data quality): 有關確定資料可靠性和實用價值的過程和技術。高品質的資料應該忠實展現其背後的事務程序,并能滿足在營運、決策、規劃中的預期用途。

抽取-轉換-加載 etl (extract-transform-load): 資料倉儲中的一個過程。從一個來源擷取資料,根據需求轉換資料以便接下來使用,之後把資料放置在正确的目标資料庫。

欺詐檢測(fraud detection): 識别針對特定組織或公司的疑似欺詐式轉賬、訂購、以及其他非法活動。在it系統預先設計觸發式警報,嘗試或進行此類活動會出現警告。

顧客的生命周期價值 (lifetime value, ltv): 顧客在他/她的一生中為一個公司産生的預期折算利潤。

購物籃分析(market basket analysis): 識别在交易中經常同時出現的商品組合或服務組合,例如經常被一起購買的産品。此類分析的結果被用于推薦附加商品,為陳列商品的決策提供依據等。

預測分析(predictive analytics): 從現存的資料集中提取資訊以便識别模式、預測未來收益和趨勢。在商業領域,預測模型及分析被用于分析目前資料和曆史事實,以更好了解消費者、産品、合作夥伴,并為公司識别機遇和風險。

實時決策(real time decisioning, rtd): 幫助企業做出實時(近乎無延遲)的最優銷售/營銷決策。比如,實時決策系統(打分系統)可以通過多種商業規則或模型,在顧客與公司互動的瞬間,對顧客進行評分和排名。

留存/顧客留存(retention / customer retention): 指建立後能夠長期維持的客戶關系的百分比。

社交網絡分析(social network analysis, sna): 描繪并測量人與人、組與組、機構與機構、電腦與電腦、url與url、以及其他種類相連的資訊/知識實體之間的關系與流動。這些人或組是網絡中的節點,而它們之間的連線表示關系或流動。sna為分析人際關系提供了一種方法,既是數學的又是視覺的。

生存分析(survival analysis): 估測一名顧客繼續使用某業務的時間,或在後續時段流失的可能性。此類資訊能讓企業判斷所要預測時段的顧客留存,并引入合适的忠誠度政策。

非結構化資料(unstructured data):資料要麼缺乏事先定義的資料模型,要麼沒按事先定義的規範進行組織。這個術語通常指那些不能放在傳統的列式資料庫中的資訊,比如電子郵件資訊、評論。

網絡挖掘/網絡資料挖掘(web mining / web data mining) : 使用資料挖掘技術從網際網路站點、文檔或服務中自動發現和提取資訊。

本文作者:佚名

來源:51cto

上一篇: pytest使用
下一篇: Pytest(四)