資料挖掘與預測分析術語總結

資料挖掘目前在各類企業和機構中蓬勃發展。是以我們制作了一份此領域常見術語總結，希望你喜歡。

大資料（big data）: 大資料既是一個被濫用的流行語，也是一個當今社會的真實趨勢。此術語指代總量與日俱增的資料，這些資料每天都在被捕獲、處理、彙集、儲存、分析。維基百科是這樣描述“大資料”的：“資料集的總和如此龐大複雜，以至于現有的資料庫管理工具難以處理（…）”。

流失分析（churn analysis/attrition analysis）: 描述哪些顧客可能停止使用公司的産品/業務，以及識别哪些顧客的流失會帶來最大損失。流失分析的結果用于為可能要流失的顧客準備新的優惠。

聯合分析/權衡分析（conjoint analysis/ trade-off analysis）: 在消費者實際使用的基礎上，比較同一産品/服務的幾個不同變種。它能預測産品/服務上市後的接受度，用于産品線管理、定價等活動。

信用評分（credit scoring）: 評估一個實體（公司或個人）的信用值。銀行（借款人）以此判斷借款者是否會還款。

配套銷售/增值銷售（cross / up selling）: 一個營銷概念。根據特定消費者的特征和過往行為，向其銷售補充商品（配套銷售）或附加商品（增值銷售）。

資料集市（data mart）: 特定機構所儲存的，關于一個特定主題或部門的資料，如銷售、财務、營銷資料。

資料品質（data quality）: 有關確定資料可靠性和實用價值的過程和技術。高品質的資料應該忠實展現其背後的事務程序，并能滿足在營運、決策、規劃中的預期用途。

抽取-轉換-加載 etl (extract-transform-load): 資料倉儲中的一個過程。從一個來源擷取資料，根據需求轉換資料以便接下來使用，之後把資料放置在正确的目标資料庫。

欺詐檢測（fraud detection）: 識别針對特定組織或公司的疑似欺詐式轉賬、訂購、以及其他非法活動。在it系統預先設計觸發式警報，嘗試或進行此類活動會出現警告。

顧客的生命周期價值 (lifetime value, ltv)：顧客在他/她的一生中為一個公司産生的預期折算利潤。

購物籃分析（market basket analysis）: 識别在交易中經常同時出現的商品組合或服務組合，例如經常被一起購買的産品。此類分析的結果被用于推薦附加商品，為陳列商品的決策提供依據等。

預測分析（predictive analytics）: 從現存的資料集中提取資訊以便識别模式、預測未來收益和趨勢。在商業領域，預測模型及分析被用于分析目前資料和曆史事實，以更好了解消費者、産品、合作夥伴，并為公司識别機遇和風險。

實時決策（real time decisioning, rtd）: 幫助企業做出實時（近乎無延遲）的最優銷售/營銷決策。比如，實時決策系統（打分系統）可以通過多種商業規則或模型，在顧客與公司互動的瞬間，對顧客進行評分和排名。

留存/顧客留存（retention / customer retention): 指建立後能夠長期維持的客戶關系的百分比。

社交網絡分析（social network analysis, sna）: 描繪并測量人與人、組與組、機構與機構、電腦與電腦、url與url、以及其他種類相連的資訊/知識實體之間的關系與流動。這些人或組是網絡中的節點，而它們之間的連線表示關系或流動。sna為分析人際關系提供了一種方法，既是數學的又是視覺的。

生存分析（survival analysis）: 估測一名顧客繼續使用某業務的時間，或在後續時段流失的可能性。此類資訊能讓企業判斷所要預測時段的顧客留存，并引入合适的忠誠度政策。

非結構化資料（unstructured data）：資料要麼缺乏事先定義的資料模型，要麼沒按事先定義的規範進行組織。這個術語通常指那些不能放在傳統的列式資料庫中的資訊，比如電子郵件資訊、評論。

網絡挖掘/網絡資料挖掘（web mining / web data mining) : 使用資料挖掘技術從網際網路站點、文檔或服務中自動發現和提取資訊。

本文作者：佚名

來源：51cto

資料挖掘與預測分析術語總結

繼續閱讀

淺談企業活動中進行資料分析的重要性

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

neo4j之cypher使用文檔

Ambari介紹和架構原理

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

登入plsql 報錯 the account is locked --使用者被鎖

SequoiaDB巨杉資料庫C++驅動概述

win10本地scala和spark安裝安裝scala安裝spark