超越Hadoop的大資料分析之緻謝

首先，我要衷心感謝vineet tyagi、avp和impetus的創新實驗室主管。vineet對我幫助很大，并促使我寫這本書。在6、7月份，每個工作日他給我3個小時的時間寫作本書，這是幫助我完成本書的關鍵。任何學術活動都要專門花費很多時間——這時候就得加倍努力，因為我必須在工作之餘寫作。vineet令寫作成為我工作的一部分。

我也想對pankaj mittal、cto和svp、impetus表示感謝，他對研發的全心支援，像我這樣的研發全職工作。榮譽對他來說，就是impetus能夠有一個無支付和收入壓力的研發團隊。這真的釋放了我并有助于我專注于研發。在it行業工作，寫書是一個艱巨的任務。感謝pankaj實作這點及類似的活動。

praveen kankariya是impetus的ceo，他是我靈感的源泉，指導着我。感謝praveen的支援！我還要感謝在impetus的nitin agarwal博士、avp和上司、資料科學實踐小組。nitin幫助我塑造一些思想，尤其是在我們讨論機器學習算法的認識/實作之後。他是一個我敬仰的、擅長從生活中找到靈感的人。nitin是印度管理學院（iim）印多爾的前教授，這充分展現了我對他的高評價。

這本書的形成離不開pranay tonpay，他是impetus的資深架構師，在我的研發團隊主導實時分析流。他一直在幫助實作本書的思想，包括在spark和storm上的一些機器學習算法。他是我團隊中首要感謝的人，特别感謝pranay。

jayati tiwari是impetus的資深軟體工程師，在spark和storm上貢獻一些機器學習算法。她對storm非常了解——其實，她是被視為團隊中的storm專家。她開發了一種傾向于了解的機器學習和spark。團隊因她的存在，增添不少樂趣。感謝jayati！

sai sagar是impetus的軟體工程師，在graphlab上幫助機器學習算法的實作。感謝sagar，很高興團隊擁有你。

ankit sharma是impetus的原資料科學家，現在是snapdeal的研發工程師，他寫了邏輯回歸（lr）的一小部分，這是本書第3章解釋lr的基礎。還有我們在機器學習上的一些很好的讨論，感謝ankit。

我還要感謝編輯者jeanne levine、lori lyons 和其他從業人員pearson，他們一直在幫助這本書從我給的雛形到最終形态。還要感謝pearson這家出版社，使得這本書面世。

我要感謝gurvinder arora，他是我們的技術作家，審閱了本書的各個章節。

我想借此機會感覺我的博士指導教授，印度理工學院(iit)馬德拉斯的janakiram博士，他在我成長的歲月裡激勵着我走向研究所學生涯。我欠他很多——他塑造了我的技術思想，道德價值觀，并使我學會将整個職業生涯作為靈感的來源。其實，寫這本書的想法靈感來源于他最近釋出的書(building large scale software systems with tata mcgraw-hill publishers)。不僅僅要感謝dj教授，我還要感謝我所有的老師，從我在sankara的高中學校開始，在sri venkateshwara college 學院（svce）的教師和所有在iit馬德拉斯的教授，是他們成就了我的今天。

我要感謝edd dumbill博士，以前在o’reilly，現在是矽谷資料科學的vp——他是大資料的編輯者，也是我發表文章所在地。他一直幫忙審閱這本書。他是2013年2月加州strata會議的組織者，當時我談論了一些beyond-hadoop的概念。這些談論本質上也是為了這本書。我也借此機會感謝strata組織者接受我一些談論的建議。

我也要感謝paco nathan博士審閱這本書，并且為這本書寫了前言。他的評論很鼓舞人心，正如他的職業生涯一樣。我很崇拜他，感謝paco！

我還要感謝團隊的其他成員pranav ganguly，他是impetus的資深架構師，給了我足夠大的壓力，并且順利處理大資料管理線程。非常高興團隊擁有他和nishant garg。感謝我的所有團隊成員。

如果沒有一個強大的家庭後盾，那将是困難的，甚至不可能寫成這本書。我的妻子vidya在確定家庭和睦、幸福中扮演着重要角色。她獻出我們本可以一起共度的大量時間，以緻于我可以專注的寫書。我的孩子prahaladh和purvajaa已足夠成熟來讓我做這個工作。感謝他們三個共同營造一個甜蜜的家庭。我也要感謝我的父母，在我的生命中，他們對我早期的教育、灌輸道德。

最後，也是必不可少的。感謝上帝給了我一切，永遠感謝全能的主照顧我。

超越Hadoop的大資料分析之緻謝

繼續閱讀

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

9.spark Core 進階2--Cashe

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

C++ 第十五周報告1--《冒泡法排序》

淺談企業活動中進行資料分析的重要性

ubuntu14.04下安裝hbse1.0.1.1

筆試面試題目：滑動視窗(二)

User Defined Hadoop DataType

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希