天天看點

阿裡巴巴常考面試題及彙總答案

原文位址:http://blog.csdn.net/free0sky/article/details/7927275

一、String,StringBuffer, StringBuilder 的差別是什麼?String為什麼是不可變的?

答:   1、String是字元串常量,StringBuffer和StringBuilder都是字元串變量。後兩者的字元内容可變,而前者建立後内容不可變。

2、String不可變是因為在JDK中String類被聲明為一個final類。

3、StringBuffer是線程安全的,而StringBuilder是非線程安全的。

ps:線程安全會帶來額外的系統開銷,是以StringBuilder的效率比StringBuffer高。如果對系統中的線程是否安全很掌握,可用StringBuffer,線上程不安全處加上關鍵字Synchronize。

二、Vector,ArrayList, LinkedList的差別是什麼?

答:   1、Vector、ArrayList都是以類似數組的形式存儲在記憶體中,LinkedList則以連結清單的形式進行存儲。

2、List中的元素有序、允許有重複的元素,Set中的元素無序、不允許有重複元素。

3、Vector線程同步,ArrayList、LinkedList線程不同步。

4、LinkedList适合指定位置插入、删除操作,不适合查找;ArrayList、Vector适合查找,不适合指定位置的插入、删除操作。

5、ArrayList在元素填滿容器時會自動擴充容器大小的50%,而Vector則是100%,是以ArrayList更節省空間。

          詳見:http://www.cnblogs.com/mgod/archive/2007/08/05/844011.html

三、HashTable, HashMap,TreeMap差別?

答:   1、HashTable線程同步,HashMap非線程同步。

2、HashTable不允許<鍵,值>有空值,HashMap允許<鍵,值>有空值。

3、HashTable使用Enumeration,HashMap使用Iterator。

4、HashTable中hash數組的預設大小是11,增加方式的old*2+1,HashMap中hash數組的預設大小是16,增長方式一定是2的指數倍。

5、TreeMap能夠把它儲存的記錄根據鍵排序,預設是按升序排序。

詳見:http://www.zlmind.com/?p=679

五、Tomcat,Apache,JBoss的差別?

答:   1、Apache是Http伺服器,Tomcat是web伺服器,JBoss是應用伺服器。

2、Apache解析靜态的html檔案;Tomcat可解析jsp動态頁面、也可充當servlet容器。

詳見:http://foohsinglong.iteye.com/blog/1195780

六、GET,POST差別?

答:   基礎知識:Http的請求格式如下。

<request line>           主要包含三個資訊:1、請求的類型(GET或POST),2、要通路的資源(如\res\img\a.jif),3、Http版本(http/1.1)

<header>                 用來說明伺服器要使用的附加資訊

<blank line>              這是Http的規定,必須空一行

[<request-body>]      請求的内容資料

差別:

1、Get是從伺服器端擷取資料,Post則是向伺服器端發送資料。

2、在用戶端,Get方式通過URL送出資料,在URL位址欄可以看到請求消息,該消息被編碼過;Post資料則是放在Html header内送出。

3、對于Get方式,伺服器端用Request.QueryString擷取變量的值;對用Post方式,伺服器端用Request.Form擷取送出的資料值。

4、Get方式送出的資料最多1024位元組,而Post則沒有限制。

5、Get方式送出的參數及參數值會在位址欄顯示,不安全,而Post不會,比較安全。

詳見:http://www.cnblogs.com/wxf0701/archive/2008/08/17/1269798.html

七、Session, Cookie差別

答:   1、Session由應用伺服器維護的一個伺服器端的存儲空間;Cookie是用戶端的存儲空間,由浏覽器維護。

2、使用者可以通過浏覽器設定決定是否儲存Cookie,而不能決定是否儲存Session,因為Session是由伺服器端維護的。

3、Session中儲存的是對象,Cookie中儲存的是字元串。

4、Session和Cookie不能跨視窗使用,每打開一個浏覽器系統會賦予一個SessionID,此時的SessionID不同,若要完成跨浏覽器通路資料,可以使用       Application。

5、Session、Cookie都有失效時間,過期後會自動删除,減少系統開銷。

詳見:http://www.chinahtml.com/1007/128010707619425.html

八、Servlet的生命周期

答:   大緻分為4部:Servlet類加載-->執行個體化-->服務-->銷毀

        下圖是Tomcat中Servlet時序圖。

阿裡巴巴常考面試題及彙總答案

1、Web Client向Servlet容器(Tomcat)發出Http請求。

2、Servlet容器接收Client端的請求。

3、Servlet容器建立一個HttpRequest對象,将Client的請求資訊封裝到這個對象中。

4、Servlet建立一個HttpResponse對象。

5、Servlet調用HttpServlet對象的service方法,把HttpRequest對象和HttpResponse對象作為參數傳遞給HttpServlet對象中。

6、HttpServlet調用HttpRequest對象的方法,擷取Http請求,并進行相應處理。

7、處理完成HttpServlet調用HttpResponse對象的方法,傳回響應資料。

8、Servlet容器把HttpServlet的響應結果傳回用戶端。

        其中的3個方法說明了Servlet的生命周期:

1、init():負責初始化Servlet對象。

2、service():負責響應用戶端請求。

3、destroy():當Servlet對象推出時,負責釋放占用資源。

詳見:http://sunnylocus.iteye.com/blog/342996

九、HTTP 封包包含内容

答:   主要包含四部分:

1、request line

2、header line

3、blank line

4、request body

詳見:http://blog.csdn.net/heruiup/article/details/6072961

十、Statement與PreparedStatement的差別,什麼是SQL注入,如何防止SQL注入

答:   1、PreparedStatement支援動态設定參數,Statement不支援。

2、PreparedStatement可避免如類似 單引号 的編碼麻煩,Statement不可以。

3、PreparedStatement支援預編譯,Statement不支援。

4、在sql語句出錯時PreparedStatement不易檢查,而Statement則更便于查錯。

5、PreparedStatement可防止Sql助于,更加安全,而Statement不行。

 詳見:http://blog.163.com/[email protected]/blog/static/1659548562010927222912/

 什麼是SQL注入:

 通過sql語句的拼接達到無參數查詢資料庫資料目的的方法。

 如将要執行的sql語句為 select * from table where name = "+appName+",利用appName參數值的輸入,來生成惡意的sql語句,如将['or'1'='1']  傳入可在資料庫中執行。

 是以可以采用PrepareStatement來避免Sql注入,在伺服器端接收參數資料後,進行驗證,此時PrepareStatement會自動檢測,而Statement不  行,需要手工檢測。

十一、sendRedirect, foward差別

答:   1、foward是伺服器端控制頁面轉向,在用戶端的浏覽器位址中不會顯示轉向後的位址;sendRedirect則是完全的跳轉,浏覽器中會顯示跳轉的位址并重             新發送請求連結。

原理:forward是伺服器請求資源,伺服器直接通路目标位址的URL,把那個URL的響應内容讀取過來,然後再将這些内容傳回給浏覽器,浏覽器根本不知         道伺服器發送的這些内容是從哪來的,是以位址欄還是原來的位址。

        redirect是伺服器端根據邏輯,發送一個狀态碼,告訴浏覽器重新去請求的那個位址,浏覽器會用剛才的所有參數重新發送新的請求。

詳見:http://dubaopeng.iteye.com/blog/1056564

十二、關于JAVA記憶體模型,一個對象(兩個屬性,四個方法)執行個體化100次,現在記憶體中的存儲狀态,幾個對象,幾個屬性,幾個方法。

答:   由于JAVA中new出來的對象都是放在堆中,是以如果要執行個體化100次,将在堆中産生100個對象,一般對象與其中的屬性、方法都屬于一個整體,但如果         屬性和方法是靜态的,就是用static關鍵字聲明的,那麼屬于類的屬性和方法永遠隻在記憶體中存在一份。

詳見:http://wenwen.soso.com/z/q252323203.htm?sp=4000

十三、談談Hibernate的了解,一級和二級緩存的作用,在項目中Hibernate都是怎麼使用緩存的。

答:   Hibernate是一個開發的對象關系映射架構(ORM)。它對JDBC進行了非常對象封裝,Hibernate允許程式員采用面向對象的方式來操作關系資料庫。

Hibernate的優點:

1、程式更加面向對象

2、提高了生産率

3、友善移植

4、無入侵性。

缺點:

1、效率比JDBC略差

2、不适合批量操作

3、隻能配置一種關聯關系

Hibernate有四種查詢方式:

1、get、load方法,根據id号查詢對象。

2、Hibernate query language

3、标準查詢語言

4、通過sql查詢

Hibernage工作原理:

1、配置hibernate對象關系映射檔案、啟動伺服器

2、伺服器通過執行個體化Configuration對象,讀取hibernate.cfg.xml檔案的配置内容,并根據相關的需求建好表以及表之間的映射關系。

3、通過執行個體化的Configuration對象建立SeesionFactory執行個體,通過SessionFactory執行個體建立Session對象。

4、通過Seesion對象完成資料庫的增删改查操作。

Hibernate中的狀态轉移

臨時狀态(transient)

1、不處于session緩存中

2、資料庫中沒有對象記錄

java是如何進入臨時狀态的:1、通過new語句建立一個對象時。2、剛調用session的delete方法時,從seesion緩存中删除一個對象時。

持久化狀态(persisted)

1、處于session緩存中

2、持久化對象資料庫中沒有對象記錄

3、seesion在特定的時刻會儲存兩者同步

java如何進入持久化狀态:1、seesion的save()方法。2、seesion的load().get()方法傳回的對象。3、seesion的find()方法傳回的list集合中存放的對象。4、Session的update().save()方法。

流離狀态(detached)

1、不再位于session緩存中

2、遊離對象由持久化狀态轉變而來,資料庫中還沒有相應記錄。

java如何進入流離狀态:1、Session的close()。Session的evict()方法,從緩存中删除一個對象。

具體如下圖所示:

阿裡巴巴常考面試題及彙總答案

Hibernate中的緩存主要有Session緩存(一級緩存)和SessionFactory緩存(二級緩存,一般由第三方提供)。

詳見:http://wxg6203.iteye.com/blog/766947     http://jyjiao2007.iteye.com/blog/760554

十四、反射講一講,主要是概念,都在哪需要反射機制,反射的性能,如何優化

答:   反射機制的定義:

是在運作狀态中,對于任意的一個類,都能夠知道這個類的所有屬性和方法,對任意一個對象都能夠通過反射機制調用一個類的任意方法,這種動态擷取類資訊及動态調用類對象方法的功能稱為java的反射機制。
反射的作用:
1、動态地建立類的執行個體,将類綁定到現有的對象中,或從現有的對象中擷取類型。

2、應用程式需要在運作時從某個特定的程式集中載入一個特定的類

詳見:http://blog.csdn.net/p785810989/article/details/6495956

十五、談談Hibernate與Ibatis的差別,哪個性能會更高一些

答:   1、Hibernate偏向于對象的操作達到資料庫相關操作的目的;而ibatis更偏向于sql語句的優化。

2、Hibernate的使用的查詢語句是自己的hql,而ibatis則是标準的sql語句。

3、Hibernate相對複雜,不易學習;ibatis類似sql語句,簡單易學。

性能方面:

1、如果系統資料處理量巨大,性能要求極為苛刻時,往往需要人工編寫高性能的sql語句或存錯過程,此時ibatis具有更好的可控性,是以性能優于Hibernate。

2、同樣的需求下,由于hibernate可以自動生成hql語句,而ibatis需要手動寫sql語句,此時采用Hibernate的效率高于ibatis。

詳見:http://blog.csdn.net/cdh1213/article/details/5967405     http://wenku.baidu.com/view/06c4486aaf1ffc4ffe47acfb.html

十六、對Spring的了解,項目中都用什麼?怎麼用的?對IOC、和AOP的了解及實作原理

答:   Spring是一個開源架構,處于MVC模式中的控制層,它能應對需求快速的變化,其主要原因它有一種面向切面程式設計(AOP)的優勢,其次它提升了系統性能,因為通過          依賴倒置機制(IOC),系統中用到的對象不是在系統加載時就全部執行個體化,而是在調用到這個類時才會執行個體化該類的對象,進而提升了系統性能。這兩個優秀的性能            使得Spring受到許多J2EE公司的青睐,如阿裡裡中使用最多的也是Spring相關技術。

Spring的優點:

1、降低了元件之間的耦合性,實作了軟體各層之間的解耦。

2、可以使用容易提供的衆多服務,如事務管理,消息服務,日志記錄等。

3、容器提供了AOP技術,利用它很容易實作如權限攔截、運作期監控等功能。

Spring中AOP技術是設計模式中的動态代理模式。隻需實作jdk提供的動态代理接口InvocationHandler,所有被代理對象的方法都由InvocationHandler接管實際的處理任務。面向切面程式設計中還要了解切入點、切面、通知、織入等概念。

Spring中IOC則利用了Java強大的反射機制來實作。所謂依賴注入即元件之間的依賴關系由容器在運作期決定。其中依賴注入的方法有兩種,通過構造函數注入,通過set方法進行注入。

詳見:http://www.360doc.com/content/08/0113/20/7635_970484.shtml    http://www.zlmind.com/?p=694

十七、線程同步,并發操作怎麼控制 

答:   Java中可在方法名前加關鍵字syschronized來處理當有多個線程同時通路共享資源時候的問題。syschronized相當于一把鎖,當有申請者申請該

資源時,如果該資源沒有被占用,那麼将資源傳遞給這個申請者使用,在此期間,其他申請者隻能申請而不能使用該資源,當該資源被使用完成後将釋放該資源上的鎖,其他申請者可申請使用。

并發控制主要是為了多線程操作時帶來的資源讀寫問題。如果不加以空間可能會出現死鎖,讀髒資料、不可重複讀、丢失更新等異常。

并發操作可以通過加鎖的方式進行控制,鎖又可分為樂觀鎖和悲觀鎖。

悲觀鎖:

悲觀鎖并發模式假定系統中存在足夠多的資料修改操作,以緻于任何确定的讀操作都可能會受到由個别的使用者所制造的資料修改的影響。也就是說悲觀鎖假定沖突總會發生,通過獨占正在被讀取的資料來避免沖突。但是獨占資料會導緻其他程序無法修改該資料,進而産生阻塞,讀資料和寫資料會互相阻塞。

樂觀鎖:

樂觀鎖假定系統的資料修改隻會産生非常少的沖突,也就是說任何程序都不大可能修改别的程序正在通路的資料。樂觀并發模式下,讀資料和寫資料之間不會發生沖突,隻有寫資料與寫資料之間會發生沖突。即讀資料不會産生阻塞,隻有寫資料才會産生阻塞。

詳見:http://www.cnblogs.com/ego/articles/1514350.html      http://blog.csdn.net/niu870781892/article/details/6140755

十八、描述struts的工作流程

答:   1、在web應用啟動時,加載并初始化ActionServlet,ActionServlet從struts-config.xml檔案中讀取配置資訊,将它們存放到各個配置對象中。

2、當ActionServlet接收到一個客戶請求時,首先檢索和使用者請求相比對的ActionMapping執行個體,如果不存在,就傳回使用者請求路徑無效資訊。

3、如果ActionForm執行個體不存在,就建立一個ActionForm對象,把客戶送出的表單資料儲存到ActionForm對象中。

4、根據配置資訊決定是否需要驗證表單,如果需要,就調用ActionForm的validate()方法,如果ActionForm的validate()方法傳回null或傳回一個不包含ActionMessage的ActionErrors對象,就表示表單驗證成功。

5、ActionServlet根據ActionMapping執行個體包含的映射資訊決定請求轉發給哪個Action,如果相應的Action執行個體不存在,就先建立一個執行個體,然後調用Action的execute()方法。

6、Action的execute()方法傳回一個ActionForward對象,ActionServlet再把客戶請求轉發給ActionForward對象指向的JSP元件。

7、ActionForward對象指向的JSP元件生成動态網頁,傳回給客戶。

十九、Tomcat的session處理,如果讓你實作一個tomcatserver,如何實作session機制 

答:   沒有找到合适的答案。

二十、關于Cache(Ehcache,Memcached) 

答:   詳見:http://xuezhongfeicn.blog.163.com/blog/static/2246014120106144143737/

二一、sql的優化相關問題

答:   這篇文章寫的真心不錯,值得仔細拜讀,是以将其轉載過來了。

近期因工作需要,希望比較全面的總結下SQL SERVER資料庫性能優化相關的注意事項,在網上搜尋了一下,發現很多文章,有的都列出了上百條,但是仔細看發現,有很多似是而非或者過時(可能對SQL SERVER6.5以前的版本或者ORACLE是适用的)的資訊,隻好自己根據以前的經驗和測試結果進行總結了。

我始終認為,一個系統的性能的提高,不單單是試運作或者維護階段的性能調優的任務,也不單單是開發階段的事情,而是在整個軟體生命周期都需要注意,進行有效工作才能達到的。是以我希望按照軟體生命周期的不同階段來總結資料庫性能優化相關的注意事項。

一、             分析階段

一 般來說,在系統分析階段往往有太多需要關注的地方,系統各種功能性、可用性、可靠性、安全性需求往往吸引了我們大部分的注意力,但是,我們必須注意,性能 是很重要的非功能性需求,必須根據系統的特點确定其實時性需求、響應時間的需求、硬體的配置等。最好能有各種需求的量化的名額。

另一方面,在分析階段應該根據各種需求區分出系統的類型,大的方面,區分是OLTP(聯機事務處理系統)和OLAP(聯機分析處理系統)。

二、             設計階段

設計階段可以說是以後系統性能的關鍵階段,在這個階段,有一個關系到以後幾乎所有性能調優的過程—資料庫設計。

在資料庫設計完成後,可以進行初步的索引設計,好的索引設計可以指導編碼階段寫出高效率的代碼,為整個系統的性能打下良好的基礎。

以下是性能要求設計階段需要注意的:

1、 資料庫邏輯設計的規範化

資料庫邏輯設計的規範化就是我們一般所說的範式,我們可以這樣來簡單了解範式:

第1規範:沒有重複的組或多值的列,這是資料庫設計的最低要求。

第2規範: 每個非關鍵字段必須依賴于主關鍵字,不能依賴于一個組合式主關鍵字的某些組成部分。消除部分依賴,大部分情況下,資料庫設計都應該達到第二範式。

第3規範: 一個非關鍵字段不能依賴于另一個非關鍵字段。消除傳遞依賴,達到第三範式應該是系統中大部分表的要求,除非一些特殊作用的表。

更高的範式要求這裡就不再作介紹了,個人認為,如果全部達到第二範式,大部分達到第三範式,系統會産生較少的列和較多的表,因而減少了資料備援,也利于性能的提高。

2、 合理的備援

完全按照規範化設計的系統幾乎是不可能的,除非系統特别的小,在規範化設計後,有計劃地加入備援是必要的。

備援可以是備援資料庫、備援表或者備援字段,不同粒度的備援可以起到不同的作用。

備援可以是為了程式設計友善而增加,也可以是為了性能的提高而增加。從性能角度來說,備援資料庫可以分散資料庫壓力,備援表可以分散資料量大的表的并發壓力,也可以加快特殊查詢的速度,備援字段可以有效減少資料庫表的連接配接,提高效率。

3、 主鍵的設計

主鍵是必要的,SQL SERVER的主鍵同時是一個唯一索引,而且在實際應用中,我們往往選擇最小的鍵組合作為主鍵,是以主鍵往往适合作為表的聚集索引。聚集索引對查詢的影響是比較大的,這個在下面索引的叙述。

在有多個鍵的表,主鍵的選擇也比較重要,一般選擇總的長度小的鍵,小的鍵的比較速度快,同時小的鍵可以使主鍵的B樹結構的層次更少。

主鍵的選擇還要注意組合主鍵的字段次序,對于組合主鍵來說,不同的字段次序的主鍵的性能差别可能會很大,一般應該選擇重複率低、單獨或者組合查詢可能性大的字段放在前面。

4、 外鍵的設計

外鍵作為資料庫對象,很多人認為麻煩而不用,實際上,外鍵在大部分情況下是很有用的,理由是:

外鍵是最高效的一緻性維護方法,資料庫的一緻性要求,依次可以用外鍵、CHECK限制、規則限制、觸發器、用戶端程式,一般認為,離資料越近的方法效率越高。

謹慎使用級聯删除和級聯更新,級聯删除和級聯更新作為SQL SERVER 2000當年的新功能,在2005作 了保留,應該有其可用之處。我這裡說的謹慎,是因為級聯删除和級聯更新有些突破了傳統的關于外鍵的定義,功能有點太過強大,使用前必須确定自己已經把握好 其功能範圍,否則,級聯删除和級聯更新可能讓你的資料莫名其妙的被修改或者丢失。從性能看級聯删除和級聯更新是比其他方法更高效的方法。

5、 字段的設計

字段是資料庫最基本的機關,其設計對性能的影響是很大的。需要注意如下:

A、資料類型盡量用數字型,數字型的比較比字元型的快很多。

B、 資料類型盡量小,這裡的盡量小是指在滿足可以預見的未來需求的前提下的。

C、 盡量不要允許NULL,除非必要,可以用NOT NULL+DEFAULT代替。

D、少用TEXT和IMAGE,二進制字段的讀寫是比較慢的,而且,讀取的方法也不多,大部分情況下最好不用。

E、 自增字段要慎用,不利于資料遷移。

6、 資料庫實體存儲和環境的設計

在設計階段,可以對資料庫的實體存儲、作業系統環境、網絡環境進行必要的設計,使得我們的系統在将來能适應比較多的使用者并發和比較大的資料量。

這裡需要注意檔案組的作用,适用檔案組可以有效把I/O操作分散到不同的實體硬碟,提高并發能力。

7、 系統設計

整個系統的設計特别是系統結構設計對性能是有很大影響的,對于一般的OLTP系統,可以選擇C/S結構、三層的C/S結構等,不同的系統結構其性能的關鍵也有所不同。

系統設計階段應該歸納一些業務邏輯放在資料庫程式設計實作,資料庫程式設計包括資料庫存儲過程、觸發器和函數。用資料庫程式設計實作業務邏輯的好處是減少網絡流量并可更充分利用資料庫的預編譯和緩存功能。

8、 索引的設計

在設計階段,可以根據功能和性能的需求進行初步的索引設計,這裡需要根據預計的資料量和查詢來設計索引,可能與将來實際使用的時候會有所差別。

關于索引的選擇,應改主意:

A、              根據資料量決定哪些表需要增加索引,資料量小的可以隻有主鍵。

B、              根據使用頻率決定哪些字段需要建立索引,選擇經常作為連接配接條件、篩選條件、聚合查詢、排序的字段作為索引的候選字段。

C、              把經常一起出現的字段組合在一起,組成組合索引,組合索引的字段順序與主鍵一樣,也需要把最常用的字段放在前面,把重複率低的字段放在前面。

D、              一個表不要加太多索引,因為索引影響插入和更新的速度。

三、             編碼階段

編碼階段是本文的重點,因為在設計确定的情況下,編碼的品質幾乎決定了整個系統的品質。

編碼階段首先是需要所有程式員有性能意識,也就是在實作功能同時有考慮性能的思想,資料庫是能進行集合運算的工具,我們應該盡量的利用這個工具,所謂集合運算實際是批量運算,就是盡量減少在用戶端進行大資料量的循環操作,而用SQL語句或者存儲過程代替。關于思想和意識,很難說得很清楚,需要在程式設計過程中來體會。

下面羅列一些程式設計階段需要注意的事項:

1、 隻傳回需要的資料

傳回資料到用戶端至少需要資料庫提取資料、網絡傳輸資料、用戶端接收資料以及用戶端處理資料等環節,如果傳回不需要的資料,就會增加伺服器、網絡和用戶端的無效勞動,其害處是顯而易見的,避免這類事件需要注意:

A、橫向來看,不要寫SELECT *的語句,而是選擇你需要的字段。

B、 縱向來看,合理寫WHERE子句,不要寫沒有WHERE的SQL語句。

C、 注意SELECT INTO後的WHERE子句,因為SELECT INTO把資料插入到臨時表,這個過程會鎖定一些系統表,如果這個WHERE子句傳回的資料過多或者速度太慢,會造成系統表長期鎖定,諸塞其他程序。

D、對于聚合查詢,可以用HAVING子句進一步限定傳回的行。

2、 盡量少做重複的工作

這一點和上一點的目的是一樣的,就是盡量減少無效工作,但是這一點的側重點在用戶端程式,需要注意的如下:

A、              控制同一語句的多次執行,特别是一些基礎資料的多次執行是很多程式員很少注意的。

B、              減少多次的資料轉換,也許需要資料轉換是設計的問題,但是減少次數是程式員可以做到的。

C、              杜絕不必要的子查詢和連接配接表,子查詢在執行計劃一般解釋成外連接配接,多餘的連接配接表帶來額外的開銷。

D、              合并對同一表同一條件的多次UPDATE,比如

  1. UPDATE EMPLOYEE SET FNAME=’HAIWER’ WHERE EMP_ID=’ VPA30890F’
  2. UPDATE EMPLOYEE SET LNAME=’YANG’ WHERE EMP_ID=’ VPA30890F’

這兩個語句應該合并成以下一個語句

  1. UPDATE EMPLOYEE SET FNAME=’HAIWER’,LNAME=’YANG’
  2. WHERE EMP_ID=’ VPA30890F’

E、               UPDATE操作不要拆成DELETE操作+INSERT操作的形式,雖然功能相同,但是性能差别是很大的。

F、               不要寫一些沒有意義的查詢,比如

SELECT * FROM EMPLOYEE WHERE 1=2

3、 注意事務和鎖

事務是資料庫應用中和重要的工具,它有原子性、一緻性、隔離性、持久性這四個屬性,很多操作我們都需要利用事務來保證資料的正确性。在使用事務中我們需要做到盡量避免死鎖、盡量減少阻塞。具體以下方面需要特别注意:

A、事務操作過程要盡量小,能拆分的事務要拆分開來。

B、 事務操作過程不應該有互動,因為互動等待的時候,事務并未結束,可能鎖定了很多資源。

C、 事務操作過程要按同一順序通路對象。

D、提高事務中每個語句的效率,利用索引和其他方法提高每個語句的效率可以有效地減少整個事務的執行時間。

E、 盡量不要指定鎖類型和索引,SQL SERVER允許我們自己指定語句使用的鎖類型和索引,但是一般情況下,SQL SERVER優化器選擇的鎖類型和索引是在目前資料量和查詢條件下是最優的,我們指定的可能隻是在目前情況下更有,但是資料量和資料分布在将來是會變化的。

F、 查詢時可以用較低的隔離級别,特别是報表查詢的時候,可以選擇最低的隔離級别(未送出讀)。

4、 注意臨時表和表變量的用法

在複雜系統中,臨時表和表變量很難避免,關于臨時表和表變量的用法,需要注意:

A、如果語句很複雜,連接配接太多,可以考慮用臨時表和表變量分步完成。

B、 如果需要多次用到一個大表的同一部分資料,考慮用臨時表和表變量暫存這部分資料。

C、 如果需要綜合多個表的資料,形成一個結果,可以考慮用臨時表和表變量分步彙總這多個表的資料。

D、其他情況下,應該控制臨時表和表變量的使用。

E、 關于臨時表和表變量的選擇,很多說法是表變量在記憶體,速度快,應該首選表變量,但是在實際使用中發現,這個選擇主要考慮需要放在臨時表的資料量,在資料量較多的情況下,臨時表的速度反而更快。

F、 關于臨時表産生使用SELECT INTO和CREATE TABLE + INSERT INTO的選擇,我們做過測試,一般情況下,SELECT INTO會比CREATE TABLE + INSERT INTO的方法快很多,但是SELECT INTO會鎖定TEMPDB的系統表SYSOBJECTS、SYSINDEXES、SYSCOLUMNS,在多使用者并發環境下,容易阻塞其他程序,是以我的建議是,在并發系統中,盡量使用CREATE TABLE + INSERT INTO,而大資料量的單個語句使用中,使用SELECT INTO。

G、  注意排序規則,用CREATE TABLE建立的臨時表,如果不指定字段的排序規則,會選擇TEMPDB的預設排序規則,而不是目前資料庫的排序規則。如果目前資料庫的排序規則和TEMPDB的排序規則不同,連接配接的時候就會出現排序規則的沖突錯誤。一般可以在CREATE TABLE建立臨時表時指定字段的排序規則為DATABASE_DEFAULT來避免上述問題。

5、 子查詢的用法

子查詢是一個 SELECT 查詢,它嵌套在 SELECT、INSERT、UPDATE、DELETE 語句或其它子查詢中。任何允許使用表達式的地方都可以使用子查詢。

子查詢可以使我們的程式設計靈活多樣,可以用來實作一些特殊的功能。但是在性能上,往往一個不合适的子查詢用法會形成一個性能瓶頸。

如果子查詢的條件中使用了其外層的表的字段,這種子查詢就叫作相關子查詢。相關子查詢可以用IN、NOT IN、EXISTS、NOT EXISTS引入。

關于相關子查詢,應該注意:

A、NOT IN、NOT EXISTS的相關子查詢可以改用LEFT JOIN代替寫法。比如:

  1. SELECT PUB_NAME
  2. FROM PUBLISHERS
  3. WHERE PUB_ID NOT IN
  4. (SELECT PUB_ID
  5. FROM TITLES
  6. WHERE TYPE = ’BUSINESS’)

可以改寫成:

  1. SELECT A.PUB_NAME
  2. FROM PUBLISHERS A LEFT JOIN TITLES B
  3. ON        B.TYPE = ’BUSINESS’ AND
  4. A.PUB_ID=B. PUB_ID
  5. WHERE B.PUB_ID IS NULL
  1. SELECT TITLE
  2. FROM TITLES
  3. WHERE NOT EXISTS
  4. (SELECT TITLE_ID
  5. FROM SALES
  6. WHERE TITLE_ID = TITLES.TITLE_ID)

可以改寫成:

  1. SELECT TITLE
  2. FROM TITLES LEFT JOIN SALES
  3. ON SALES.TITLE_ID = TITLES.TITLE_ID
  4. WHERE SALES.TITLE_ID IS NULL

B、 如果保證子查詢沒有重複 ,IN、EXISTS的相關子查詢可以用INNER JOIN 代替。比如:

  1. SELECT PUB_NAME
  2. FROM PUBLISHERS
  3. WHERE PUB_ID IN
  4. (SELECT PUB_ID
  5. FROM TITLES
  6. WHERE TYPE = ’BUSINESS’)

可以改寫成:

  1. SELECT DISTINCT A.PUB_NAME
  2. FROM PUBLISHERS A INNER JOIN TITLES B
  3. ON        B.TYPE = ’BUSINESS’ AND
  4. A.PUB_ID=B. PUB_ID

C、 IN的相關子查詢用EXISTS代替,比如

  1. SELECT PUB_NAME
  2. FROM PUBLISHERS
  3. WHERE PUB_ID IN
  4. (SELECT PUB_ID
  5. FROM TITLES
  6. WHERE TYPE = ’BUSINESS’)

可以用下面語句代替:

  1. SELECT PUB_NAME
  2. FROM PUBLISHERS
  3. WHERE EXISTS
  4. (SELECT 1
  5. FROM TITLES
  6. WHERE TYPE = ’BUSINESS’ AND
  7. PUB_ID= PUBLISHERS.PUB_ID)

D、不要用COUNT(*)的子查詢判斷是否存在記錄,最好用LEFT JOIN或者EXISTS,比如有人寫這樣的語句:

  1. SELECT JOB_DESC FROM JOBS
  2. WHERE (SELECT COUNT(*) FROM EMPLOYEE WHERE JOB_ID=JOBS.JOB_ID)=0

應該改成:

  1. SELECT JOBS.JOB_DESC FROM JOBS LEFT JOIN EMPLOYEE
  2. ON EMPLOYEE.JOB_ID=JOBS.JOB_ID
  3. WHERE EMPLOYEE.EMP_ID IS NULL
  1. SELECT JOB_DESC FROM JOBS
  2. WHERE (SELECT COUNT(*) FROM EMPLOYEE WHERE JOB_ID=JOBS.JOB_ID)<>0

應該改成:

  1. SELECT JOB_DESC FROM JOBS
  2. WHERE EXISTS (SELECT 1 FROM EMPLOYEE WHERE JOB_ID=JOBS.JOB_ID)

6、 慎用遊标

資料庫一般的操作是集合操作,也就是對由WHERE子句和選擇列确定的結果集作集合操作,遊标是提供的一個非集合操作的途徑。一般情況下,遊标實作的功能往往相當于用戶端的一個循環實作的功能,是以,大部分情況下,我們把遊标功能搬到用戶端。

遊标是把結果集放在伺服器記憶體,并通過循環一條一條處理記錄,對資料庫資源(特别是記憶體和鎖資源)的消耗是非常大的,是以,我們應該隻有在沒有其他方法的情況下才使用遊标。

另外,我們可以用SQL SERVER的一些特性來代替遊标,達到提高速度的目的。

A、字元串連接配接的例子

這是論壇經常有的例子,就是把一個表符合條件的記錄的某個字元串字段連接配接成一個變量。比如需要把JOB_ID=10的EMPLOYEE的FNAME連接配接在一起,用逗号連接配接,可能最容易想到的是用遊标:

  1. DECLARE @NAME VARCHAR(20)
  2. DECLARE @NAME VARCHAR(1000)
  3. DECLARE NAME_CURSOR CURSOR FOR
  4. SELECT FNAME FROM EMPLOYEE WHERE JOB_ID=10 ORDER BY EMP_ID
  5. OPEN NAME_CURSOR
  6. FETCH NEXT FROM RNAME_CURSOR INTO @NAME
  7. WHILE @@FETCH_STATUS = 0
  8. BEGIN
  9. SET @NAMES = ISNULL(@NAMES+’,’,’’)[email protected]
  10. FETCH NEXT FROM NAME_CURSOR  INTO @NAME
  11. END
  12. CLOSE NAME_CURSOR
  13. DEALLOCATE NAME_CURSOR

可以如下修改,功能相同:

  1. DECLARE @NAME VARCHAR(1000)
  2. SELECT @NAMES = ISNULL(@NAMES+’,’,’’)+FNAME
  3. FROM EMPLOYEE WHERE JOB_ID=10 ORDER BY EMP_ID

B、 用CASE WHEN 實作轉換的例子

很多使用遊标的原因是因為有些處理需要根據記錄的各種情況需要作不同的處理,實際上這種情況,我們可以用CASE WHEN語句進行必要的判斷處理,而且CASE WHEN是可以嵌套的。比如:

表結構:

  1. CREATE TABLE 料件表(
  2. 料号           VARCHAR(30),
  3. 名稱           VARCHAR(100),
  4. 主機關         VARCHAR(20),
  5. 機關1         VARCHAR(20),
  6. 機關1參數      NUMERIC(18,4),
  7. 機關2         VARCHAR(20),
  8. 機關2參數      NUMERIC(18,4)
  9. )
  10. GO
  11. CREATE TABLE 入庫表(
  12. 時間               DATETIME,
  13. 料号               VARCHAR(30),
  14. 機關               INT,
  15. 入庫數量           NUMERIC(18,4),
  16. 損壞數量           NUMERIC(18,4)
  17. )
  18. GO

其中,機關字段可以是0,1,2,分别代表主機關、機關1、機關2,很多計算需要統一機關,統一機關可以用遊标實作:

  1. DECLARE @料号     VARCHAR(30),
  2. @機關   INT,
  3. @參數      NUMERIC(18,4),
  4. DECLARE CUR CURSOR FOR
  5. SELECT 料号,機關 FROM 入庫表 WHERE 機關 <>0
  6. OPEN CUR
  7. FETCH NEXT FROM CUR INTO @料号,@機關
  8. WHILE @@FETCH_STATUS<>-1
  9. BEGIN
  10. IF @機關=1
  11. BEGIN
  12. SET @參數=(SELECT 機關1參數 FROM 料件表 WHERE 料号 [email protected]料号)
  13. UPDATE 入庫表 SET 數量=數量*@參數,損壞數量=損壞數量*@參數,機關=1 WHERE CURRENT OF CUR
  14. END
  15. IF @機關=2
  16. BEGIN
  17. SET @參數=(SELECT 機關1參數 FROM 料件表 WHERE 料号 [email protected]料号)
  18. UPDATE 入庫表 SET 數量=數量*@參數,損壞數量=損壞數量*@參數,機關=1 WHERE CURRENT OF CUR
  19. END
  20. FETCH NEXT FROM CUR INTO @料号,@機關
  21. END
  22. CLOSE CUR
  23. DEALLOCATE CUR

可以改寫成:

  1. UPDATE A SET
  2. 數量=CASE A.機關 WHEN 1 THEN      A.數量*B. 機關1參數
  3. WHEN 2 THEN         A.數量*B. 機關2參數
  4. ELSE A.數量
  5. END,
  6. 損壞數量= CASE A.機關 WHEN 1 THEN    A. 損壞數量*B. 機關1參數
  7. WHEN 2 THEN         A. 損壞數量*B. 機關2參數
  8. ELSE A. 損壞數量
  9. END,
  10. 機關=1
  11. FROM入庫表 A, 料件表 B
  12. WHERE    A.機關<>1      AND
  13. A.料号=B.料号

C、 變量參與的UPDATE語句的例子

SQL ERVER的語句比較靈活,變量參與的UPDATE語句可以實作一些遊标一樣的功能,比如:

  1. SELECT A,B,C,CAST(NULL AS INT) AS 序号
  2. INTO #T
  3. FROM 表
  4. ORDER BY A ,NEWID()

産生臨時表後,已經按照A字段排序,但是在A相同的情況下是亂序的,這時如果需要更改序号字段為按照A字段分組的記錄序号,就隻有遊标和變量參與的UPDATE語句可以實作了,這個變量參與的UPDATE語句如下:

  1. DECLARE @A INT
  2. DECLARE @序号 INT
  3. UPDATE #T SET
  4. @序号=CASE WHEN [email protected] THEN @序号+1 ELSE 1 END,
  5. @A=A,
  6. 序号[email protected]序号

D、如果必須使用遊标,注意選擇遊标的類型,如果隻是循環取資料,那就應該用隻進遊标(選項FAST_FORWARD),一般隻需要靜态遊标(選項STATIC)。

E、 注意動态遊标的不确定性,動态遊标查詢的記錄集資料如果被修改,會自動重新整理遊标,這樣使得動态遊标有了不确定性,因為在多使用者環境下,如果其他程序或者本身更改了紀錄,就可能重新整理遊标的記錄集。

7、 盡量使用索引

建立索引後,并不是每個查詢都會使用索引,在使用索引的情況下,索引的使用效率也會有很大的差别。隻要我們在查詢語句中沒有強制指定索引,索引的選擇和使用方法是SQLSERVER的優化器自動作的選擇,而它選擇的根據是查詢語句的條件以及相關表的統計資訊,這就要求我們在寫SQL語句的時候盡量使得優化器可以使用索引。

為了使得優化器能高效使用索引,寫語句的時候應該注意:

A、不要對索引字段進行運算,而要想辦法做變換,比如

SELECT ID FROM T WHERE NUM/2=100

應改為:

SELECT ID FROM T WHERE NUM=100*2

SELECT ID FROM T WHERE NUM/2=NUM1

如果NUM有索引應改為:

SELECT ID FROM T WHERE NUM=NUM1*2

如果NUM1有索引則不應該改。

發現過這樣的語句:

  1. SELECT 年,月,金額 FROM 結餘表
  2. WHERE 100*年+月=2007*100+10

應該改為:

  1. SELECT 年,月,金額 FROM 結餘表
  2. WHERE 年=2007 AND
  3. 月=10

B、 不要對索引字段進行格式轉換

日期字段的例子:

WHERE CONVERT(VARCHAR(10), 日期字段,120)=’2008-08-15’

應該改為

WHERE日期字段〉=’2008-08-15’         AND   日期字段<’2008-08-16’

ISNULL轉換的例子:

WHERE ISNULL(字段,’’)<>’’應改為:WHERE字段<>’’

WHERE ISNULL(字段,’’)=’’不應修改

WHERE ISNULL(字段,’F’) =’T’應改為: WHERE字段=’T’

WHERE ISNULL(字段,’F’)<>’T’不應修改

C、 不要對索引字段使用函數

WHERE LEFT(NAME, 3)=’ABC’ 或者WHERE SUBSTRING(NAME,1, 3)=’ABC’

應改為:

WHERE NAME LIKE ‘ABC%’

日期查詢的例子:

WHERE DATEDIFF(DAY, 日期,’2005-11-30′)=0應改為:WHERE 日期 >=’2005-11-30′ AND 日期 <’2005-12-1‘

WHERE DATEDIFF(DAY, 日期,’2005-11-30′)>0應改為:WHERE 日期 <’2005-11-30‘

WHERE DATEDIFF(DAY, 日期,’2005-11-30′)>=0應改為:WHERE 日期 <’2005-12-01‘

WHERE DATEDIFF(DAY, 日期,’2005-11-30′)<0應改為:WHERE 日期>=’2005-12-01‘

WHERE DATEDIFF(DAY, 日期,’2005-11-30′)<=0應改為:WHERE 日期>=’2005-11-30‘

D、不要對索引字段進行多字段連接配接

比如:

WHERE FAME+ ’.’+LNAME=‘HAIWEI.YANG’

應改為:

WHERE FNAME=‘HAIWEI’ AND LNAME=‘YANG’

8、 注意連接配接條件的寫法

多表連接配接的連接配接條件對索引的選擇有着重要的意義,是以我們在寫連接配接條件條件的時候需要特别的注意。

A、多表連接配接的時候,連接配接條件必須寫全,甯可重複,不要缺漏。

B、 連接配接條件盡量使用聚集索引

C、 注意ON部分條件和WHERE部分條件的差別

9、 其他需要注意的地方

經驗表明,問題發現的越早解決的成本越低,很多性能問題可以在編碼階段就發現,為了提早發現性能問題,需要注意:

A、程式員注意、關心各表的資料量。

B、 編碼過程和單元測試過程盡量用資料量較大的資料庫測試,最好能用實際資料測試。

C、 每個SQL語句盡量簡單

D、不要頻繁更新有觸發器的表的資料

E、 注意資料庫函數的限制以及其性能

10、              學會分辯SQL語句的優劣

自己分辨SQL語句的優劣非常重要,隻有自己能分辨優劣才能寫出高效的語句。

A、              檢視SQL語句的執行計劃,可以在查詢分析其使用CTRL+L圖形化的顯示執行計劃,一般應該注意百分比最大的幾個圖形的屬性,把滑鼠移動到其上面會顯示這個圖形的屬性,需要注意預計成本的資料,也要注意其标題,一般都是CLUSTERED INDEX SEEK 、INDEX SEEK 、CLUSTERED INDEX SCAN 、INDEX SCAN 、TABLE SCAN等,其中出現SCAN說明語句有優化的餘地。也可以用語句

SET SHOWPLAN_ALL ON

要執行的語句

SET SHOWPLAN_ALL OFF

檢視執行計劃的文本詳細資訊。

B、               用事件探查器跟蹤系統的運作,可疑跟蹤到執行的語句,以及所用的時間,CPU用量以及I/O資料,進而分析語句的效率。

C、               可以用WINDOWS的系統性能檢測器,關注CPU、I/O參數

四、             測試、試運作、維護階段

測試的主要任務是發現并修改系統的問題,其中性能問題也是一個重要的方面。重點應該放在發現有性能問題的地方,并進行必要的優化。主要進行語句優化、索引優化等。

試運作和維護階段是在實際的環境下運作系統,發現的問題範圍更廣,可能涉及作業系統、網絡以及多使用者并發環境出現的問題,其優化也擴充到作業系統、網絡以及資料庫實體存儲的優化。

這個階段的優花方法在這裡不再展開,隻說明下索引維護的方法:

A、              可以用DBCC DBREINDEX語句或者SQL SERVER維護計劃設定定時進行索引重建,索引重建的目的是提高索引的效能。

B、               可以用語句UPDATE STATISTICS或者SQL SERVER維護計劃設定定時進行索引統計資訊的更新,其目的是使得統計資訊更能反映實際情況,進而使得優化器選擇更合适的索引。

C、               可以用DBCC CHECKDB或者DBCC CHECKTABLE語句檢查資料庫表和索引是否有問題,這兩個語句也能修複一般的問題。

D、

五、             網上資料中一些說法的個人不同意見

1、 “應盡量避免在 WHERE 子句中對字段進行 NULL 值判斷,否則将導緻引擎放棄使用索引而進行全表掃描,如:

SELECT ID FROM T WHERE NUM IS NULL

可以在NUM上設定預設值0,確定表中NUM列沒有NULL值,然後這樣查詢:

SELECT ID FROM T WHERE NUM=0”

個人意見:經過測試,IS NULL也是可以用INDEX SEEK查找的,0和NULL是不同概念的,以上說法的兩個查詢的意義和記錄數是不同的。

2、 “應盡量避免在 WHERE 子句中使用!=或<>操作符,否則将引擎放棄使用索引而進行全表掃描。”

個人意見:經過測試,<>也是可以用INDEX SEEK查找的。

3、 “應盡量避免在 WHERE 子句中使用 OR 來連接配接條件,否則将導緻引擎放棄使用索引而進行全表掃描,如:

SELECT ID FROM T WHERE NUM=10 OR NUM=20

可以這樣查詢:

SELECT ID FROM T WHERE NUM=10

UNION ALL

SELECT ID FROM T WHERE NUM=20”

個人意見:主要對全表掃描的說法不贊同。

4、 “IN 和 NOT IN 也要慎用,否則會導緻全表掃描,如:

SELECT ID FROM T WHERE NUM IN(1,2,3)

對于連續的數值,能用 BETWEEN 就不要用 IN 了:

SELECT ID FROM T WHERE NUM BETWEEN 1 AND 3”

個人意見:主要對全表掃描的說法不贊同。

5、 “如果在 WHERE 子句中使用參數,也會導緻全表掃描。因為SQL隻有在運作時才會解析局部變量,但優化程式不能将通路計劃的選擇推遲到運作時;它必須在編譯時進行選擇。然而,如果在編譯時建立通路計劃,變量的值還是未知的,因而無法作為索引選擇的輸入項。如下面語句将進行全表掃描:

SELECT ID FROM T WHERE [email protected]

可以改為強制查詢使用索引:

SELECT ID FROM T WITH(INDEX(索引名)) WHERE [email protected]”

個人意見:關于局部變量的解釋比較奇怪,使用參數如果會影響性能,那存儲過程就該校除了,我堅持我上面對于強制索引的看法。

6、 “盡可能的使用 VARCHAR/NVARCHAR 代替 CHAR/NCHAR ,因為首先變長字段存儲空間小,可以節省存儲空間,其次對于查詢來說,在一個相對較小的字段内搜尋效率顯然要高些。”

個人意見:“在一個相對較小的字段内搜尋效率顯然要高些”顯然是對的,但是字段的長短似乎不是由變不變長決定,而是業務本身決定。在SQLSERVER6.5或者之前版本,不定長字元串字段的比較速度比定長的字元串字段的比較速度慢很多,是以對于那些版本,我們都是推薦使用定長字段存儲一些關鍵字段。而在2000版本,修改了不定長字元串字段的比較方法,與定長字段的比較速度差别不大了,這樣為了友善,我們大量使用不定長字段。

7、 關于連接配接表的順序或者條件的順序的說法,經過測試,在SQL SERVER,這些順序都是不影響性能的,這些說法可能是對ORACLE有效。

二二、oracle中 rownum與rowid的了解,一千條記錄我查200到300的記錄怎麼查? 

答:   詳見:http://www.sunxin.org/article/242.html

如何查200到300行的記錄,可以通過top關鍵字輔助:select top 100 * from table where id is not in (select top 200 id from table);

查詢n到m行記錄的通用公式:select top m * from table where id is not in (select top n * from table)

二三、如何分析ORACLE的執行計劃? 

答:   詳見:http://blog.chinaunix.net/space.php?uid=22539324&do=blog&id=2644068

二四、 DB中索引原理,種類,使用索引的好處和問題是什麼? 

答:    經常需要修改的表不易對改變建立索引,因為資料庫對索引進行維護需要額外的開銷。對經常需要查詢的大資料表需要建立索引,這樣會增加

查詢的效率。

索引的原理:沒有找到合适的答案。

索引的種類:B*Tree、反向索引、降序索引、位圖索引、函數索引。詳見:http://wenku.baidu.com/view/d4d6ee1ba76e58fafab00336.html

二五、JVM垃圾回收實作原理。垃圾回收的線程優先級。

答:   詳見:http://chenchendefeng.iteye.com/blog/455883

二六、jvm 最大記憶體設定。設定的原理。結合垃圾回收講講。

答:   詳見:http://www.open-open.com/lib/view/open1324736648468.html

繼續閱讀