天天看点

转 URI与URL的区别

    这两天在写代码的时候,由于涉及到资源的位置,因此,需要在java bean中定义一些字段,用来表示资源的位置,比如:imgurl,logouri等等。但是,每次定义的时候,心里都很纠结,是该用imgurl还是imguri呢?

    同样的,另外一个问题:string httpservletrequest.getrequesturi();和stringbuffer httpservletrequest.getrequesturl();返回的内容有何不同?为什么会如此?

    带着这些问题到网上去搜了下,没发现让自己看了明白的解释,于是,想到了java类库里有两个对应的类java.net.uri和java.net.url,终于,在这两个类里的javadoc里找到了答案。

uris, urls, and urns

    首先,uri,是uniform resource identifier,统一资源标识符,用来唯一的标识一个资源。而url是uniform resource locator,统一资源定位器,它是一种具体的uri,即url可以用来标识一个资源,而且还指明了如何locate这个资源。而urn,uniform resource name,统一资源命名,是通过名字来标识资源,比如mailto:[email protected]。也就是说,uri是以一种抽象的,高层次概念定义统一资源标识,而url和urn则是具体的资源标识的方式。url和urn都是一种uri。

    在java的uri中,一个uri实例可以代表绝对的,也可以是相对的,只要它符合uri的语法规则。而url类则不仅符合语义,还包含了定位该资源的信息,因此它不能是相对的,schema必须被指定。

    ok,现在回答文章开头提出的问题,到底是imgurl好呢,还是imguri好?显然,如果说imguri是肯定没问题的,因为即使它实际上是url,那它也是uri的一种。那么用imgurl有没有问题呢?此时则要看它的可能取值,如果是绝对路径,能够定位的,那么用imgurl是没问题的,而如果是相对路径,那还是不要用imgurl的好。总之,用imguri是肯定没问题的,而用imgurl则要视实际情况而定。

    第二个,从httpservletrequest的javadoc中可以看出,getrequesturi返回一个string,“the part of this request’s url from the protocol name up to the query string in the first line of the http request”,比如“post /some/path.html?a=b http/1.1”,则返回的值为”/some/path.html”。现在可以明白为什么是getrequesturi而不是getrequesturl了,因为此处返回的是相对的路径。而getrequesturl返回一个stringbuffer,“the returned url contains a protocol, server name, port number, and server path, but it does not include query string parameters.”,完整的请求资源路径,不包括querystring。

    总结一下:url是一种具体的uri,它不仅唯一标识资源,而且还提供了定位该资源的信息。uri是一种语义上的抽象概念,可以是绝对的,也可以是相对的,而url则必须提供足够的信息来定位,所以,是绝对的,而通常说的relative url,则是针对另一个absolute url,本质上还是绝对的。

    注:这里的绝对(absolute)是指包含scheme,而相对(relative)则不包含scheme。

    uri抽象结构     [scheme:]scheme-specific-part[#fragment]

    [scheme:][//authority][path][?query][#fragment]

    authority为[user-info@]host[:port]

参考资料:

<a href="http://docs.oracle.com/javase/1.5.0/docs/api/java/net/uri.html">http://docs.oracle.com/javase/1.5.0/docs/api/java/net/uri.html</a>

<a href="http://en.wikipedia.org/wiki/uniform_resource_identifier">http://en.wikipedia.org/wiki/uniform_resource_identifier</a>

<a href="http://docs.oracle.com/javaee/5/api/javax/servlet/http/httpservletrequest.html">http://docs.oracle.com/javaee/5/api/javax/servlet/http/httpservletrequest.html</a>

ps:

    java.net.url类不提供对标准rfc2396规定的特殊字符的转义,因此需要调用者自己对url各组成部分进行encode。而java.net.uri则会提供转义功能。因此the recommended way  to manage the encoding and decoding of urls is to use  java.net.uri. 可以使用uri.tourl()和url.touri()方法来对两个类型的对象互相转换。对于html form的url encode/decode可以使用java.net.urlencoder和java.net.urldecoder来完成,但是对url对象不适用。