首先,我要衷心感謝vineet tyagi、avp和impetus的創新實驗室主管。vineet對我幫助很大,并促使我寫這本書。在6、7月份,每個工作日他給我3個小時的時間寫作本書,這是幫助我完成本書的關鍵。任何學術活動都要專門花費很多時間——這時候就得加倍努力,因為我必須在工作之餘寫作。vineet令寫作成為我工作的一部分。
我也想對pankaj mittal、cto和svp、impetus表示感謝,他對研發的全心支援,像我這樣的研發全職工作。榮譽對他來說,就是impetus能夠有一個無支付和收入壓力的研發團隊。這真的釋放了我并有助于我專注于研發。在it行業工作,寫書是一個艱巨的任務。感謝pankaj實作這點及類似的活動。
praveen kankariya是impetus的ceo,他是我靈感的源泉,指導着我。感謝praveen的支援!我還要感謝在impetus的nitin agarwal博士、avp和上司、資料科學實踐小組。nitin幫助我塑造一些思想,尤其是在我們讨論機器學習算法的認識/實作之後。他是一個我敬仰的、擅長從生活中找到靈感的人。nitin是印度管理學院(iim)印多爾的前教授,這充分展現了我對他的高評價。
這本書的形成離不開pranay tonpay,他是impetus的資深架構師,在我的研發團隊主導實時分析流。他一直在幫助實作本書的思想,包括在spark和storm上的一些機器學習算法。他是我團隊中首要感謝的人,特别感謝pranay。
jayati tiwari是impetus的資深軟體工程師,在spark和storm上貢獻一些機器學習算法。她對storm非常了解——其實,她是被視為團隊中的storm專家。她開發了一種傾向于了解的機器學習和spark。團隊因她的存在,增添不少樂趣。感謝jayati!
sai sagar是impetus的軟體工程師,在graphlab上幫助機器學習算法的實作。感謝sagar,很高興團隊擁有你。
ankit sharma是impetus的原資料科學家,現在是snapdeal的研發工程師,他寫了邏輯回歸(lr)的一小部分,這是本書第3章解釋lr的基礎。還有我們在機器學習上的一些很好的讨論,感謝ankit。
我還要感謝編輯者jeanne levine、lori lyons 和其他從業人員pearson,他們一直在幫助這本書從我給的雛形到最終形态。還要感謝pearson這家出版社,使得這本書面世。
我要感謝gurvinder arora,他是我們的技術作家,審閱了本書的各個章節。
我想借此機會感覺我的博士指導教授,印度理工學院(iit)馬德拉斯的janakiram博士,他在我成長的歲月裡激勵着我走向研究所學生涯。我欠他很多——他塑造了我的技術思想,道德價值觀,并使我學會将整個職業生涯作為靈感的來源。其實,寫這本書的想法靈感來源于他最近釋出的書(building large scale software systems with tata mcgraw-hill publishers)。不僅僅要感謝dj教授,我還要感謝我所有的老師,從我在sankara的高中學校開始,在sri venkateshwara college 學院(svce)的教師和所有在iit馬德拉斯的教授,是他們成就了我的今天。
我要感謝edd dumbill博士,以前在o’reilly,現在是矽谷資料科學的vp——他是大資料的編輯者,也是我發表文章所在地。他一直幫忙審閱這本書。他是2013年2月加州strata會議的組織者,當時我談論了一些beyond-hadoop的概念。這些談論本質上也是為了這本書。我也借此機會感謝strata組織者接受我一些談論的建議。
我也要感謝paco nathan博士審閱這本書,并且為這本書寫了前言。他的評論很鼓舞人心,正如他的職業生涯一樣。我很崇拜他,感謝paco!
我還要感謝團隊的其他成員pranav ganguly,他是impetus的資深架構師,給了我足夠大的壓力,并且順利處理大資料管理線程。非常高興團隊擁有他和nishant garg。感謝我的所有團隊成員。
如果沒有一個強大的家庭後盾,那将是困難的,甚至不可能寫成這本書。我的妻子vidya在確定家庭和睦、幸福中扮演着重要角色。她獻出我們本可以一起共度的大量時間,以緻于我可以專注的寫書。我的孩子prahaladh和purvajaa已足夠成熟來讓我做這個工作。感謝他們三個共同營造一個甜蜜的家庭。我也要感謝我的父母,在我的生命中,他們對我早期的教育、灌輸道德。
最後,也是必不可少的。感謝上帝給了我一切,永遠感謝全能的主照顧我。