天天看點

幫資料科學家幹髒累活,大資料初創企業Paxata獲3350萬美元D輪融資

幫資料科學家幹髒累活,大資料初創企業Paxata獲3350萬美元D輪融資

經過前幾年的炒作之後,大資料已經逐漸遠離了媒體的焦點。這并不是說大資料已經失去勢頭,相反正是由于大資料應用之廣泛已經到了幾乎任何應用都離不開的地步,司空見慣了的東西是以就無人提及。但是大資料的應用普及仍然存在一些問題,主要的問題之一就是許多環節仍然離不開人工處理。比如最開始的資料抽取、處理與整合就需要大量人力——21世紀最性感的職業很大一部分精力都用在這些髒累活上面可一點都不吸引人。是以不少創業公司都把焦點放在解放資料科學家的事情上面,paxata就是其中之一,在intel capital global summit上,這家大資料初創企業宣布獲得了3350萬美元的d輪融資。

paxata是一家提供大資料轉換平台的初創企業,成立于2012年,總部位于加州redwood city。其平台為大型企業提供了一個自服務、可視化的資訊管理管道。在資料服務領域,存儲和提供資料來源的資料管理系統(如hadoop)和利用資料的分析應用之間普遍存在的一道鴻溝,即分析應用在對資料分析之前需要抽取、處理和整合多個來源的資料才能進行分析。這個資料準備的過程以往大都需要人工處理,耗時費力,paxata的目的就是要填補這道鴻溝。他們的資料準備服務可以實作資料的連接配接、發掘、轉換、合并、釋出、協作控制等功能,可以将多來源多格式的資料接入并自動進行解釋,客戶使用人員隻需知道使用excel表,無需進行程式設計、寫腳本或者采樣即可完成資料準備的任務,這使得使用門檻大為降低。盡管paxata在最新的大資料版圖(見下圖)中被定為為資料轉換闆塊,但paxata自己也提供有資料分析服務,可以利用機器學習與語義分析技術對清洗、整合後的資料進行即時的預測性分析。

幫資料科學家幹髒累活,大資料初創企業Paxata獲3350萬美元D輪融資

2016大資料版圖

對于擁有龐大資料但是缺乏資料科學家的企業來說,paxata為他們提供了一個易用的資訊管理平台。dannon、box、ubs、pabst brewing company等均為paxata的客戶。

paxata提供的服務與clearstory有點類似,均能從不同的資料源抽取資料,但是paxata還可以将多個資料源進一步整合為單一的資料集,進而更友善業務分析師和可視化工具的了解。此外,像alteryx、tamr以及trifacta也提供了類似的自服務資料準備平台。鑒于人力是企業很大的一塊成本支出,而資料科學家80%的工作都用在了資料清理上面,這個市場的前景還是非常可觀的。當然,前提是在人工智能發展到足夠程度之前,資料本身的品質還是要有一定保障。

此輪融資由intel capital領投(paxata是這家基金這次投資峰會投資的12家初創企業之一),microsoft ventures、cisco investments、deutsche telekom capital partners、airtree ventures等新投資者以及edbi、in-q- tel、accel等原有投資者跟投,此輪融資過後,其總融資為6150萬美元。paxata 原來在紐約、華盛頓特區、俄亥俄州以及新加坡設有分支機構,此輪融資所得将用于公司在歐洲與亞洲的擴張。

本文轉自d1net(轉載)

繼續閱讀