rfc1945

 

3.2  统一资源标识(Uniform Resource Identifiers 数据挖掘实验室

  数据挖掘论坛

       URI有许多名字,如WWW地址、通用文件标识(Universal Document Identifiers)、通用资源标识(Universal Resource Identifiers [2]),以及最终的统一资源定位符(Uniform Resource Locators (URL) [4])和统一资源名(URN)。在涉及HTTP以前,URI用简单格式的字符串描述-名字、位置、或其它特性,如网络资源。

数据挖掘论坛

  数据挖掘工具

3.2.1 一般语法(General Syntax

数据挖掘研究院

       HTTPURI可以用绝对形式表示,也可用相对于某一基本URI[9]的形式表示,具体取决于它们的使用方式。这两种形式的不同在于绝对URI总是以方法名称后跟“:”开头。 数据挖掘研究院

  数据挖掘研究院

       URI                 = ( absoluteURI | relativeURI ) [ "#" fragment ]

 

       absoluteURI    = scheme ":" *( uchar | reserved )

 

数据挖掘研究院

       relativeURI     = net_path | abs_path | rel_path

数据挖掘实验室

  数据挖掘论坛

       net_path       = "//" net_loc [ abs_path ]

数据挖掘论坛

       abs_path       = "/" rel_path 数据挖掘实验室

       rel_path       = [ path ] [ ";" params ] [ "?" query ]

数据挖掘研究院

 

数据挖掘论坛

       path           = fsegment *( "/" segment )

       fsegment       = 1*pchar

数据挖掘工具

       segment        = *pchar

数据挖掘研究院

 

数据挖掘论坛

       params         = param *( ";" param ) 数据挖掘交友

       param          = *( pchar | "/" )

 

       scheme         = 1*( ALPHA | DIGIT | "+" | "-" | "." )

       net_loc        = *( pchar | ";" | "?" )

       query          = *( uchar | reserved )

数据挖掘研究院

       fragment       = *( uchar | reserved )

 

       pchar          = uchar | ":" | "@" | "&" | "=" | "+" 数据挖掘研究院

       uchar          = unreserved | escape

       unreserved     = ALPHA | DIGIT | safe | extra | national

 

       escape         = "%" HEX HEX 数据挖掘实验室

       reserved       = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" 数据挖掘实验室

       extra          = "!" | "*" | """ | "(" | ")" | ","

数据挖掘实验室

       safe           = "$" | "-" | "_" | "." 数据挖掘研究院

       unsafe         = CTL | SP | <"> | "#" | "%" | "<" | ">"

       national       = <any OCTET excluding ALPHA, DIGIT, 数据挖掘交友

 

Berners-Lee, et al           Informational                     [Page 14] 数据挖掘研究院


 

数据挖掘论坛

                        reserved, extra, safe, and unsafe>

数据挖掘论坛

       权威的URL语法及语义信息请参见RFC1738[4]RFC1808[9]。上面所提到的BNF中包括了合法URL中不允许出现的符号(RFC1738),因为HTTP服务器并没有限制为只能用非保留字符集中的字符来表示地址路径,而且HTTP代理也可能接收到RFC1738没有定义的URI请求。

数据挖掘交友

 

3.2.2 http URL

数据挖掘论坛

  数据挖掘实验室

http”表示要通过HTTP协议来定位网络资源。本节定义了HTTP URL的语法和语义。 数据挖掘交友

 

数据挖掘论坛

       http_URL       = "http:" "//" host [ ":" port ] [ abs_path ]

数据挖掘工具

  数据挖掘论坛

host           = <合法的Internet主机域名或IP地址(用十进制数及点组成) 数据挖掘论坛

,见RFC11232.1节定义> 数据挖掘交友

  数据挖掘实验室

       port           = *DIGIT 数据挖掘实验室

  数据挖掘实验室

       如是端口为空或没指定,则缺省为80端口。对于绝对路径的URI来说,拥有被请求的资源的服务器主机通过侦听该端口的TCP连接来接收该URI请求。如果URL中没有给出绝对路径,要作为请求URI(参见5.1.2节)使用,必须以“/”形式给出。

数据挖掘研究院

  数据挖掘论坛

       注意:虽然HTTP协议独立于传输层协议,http URL只是标识资源的TCP位置,而对于非TCP资源来说,必须用其它的URI形式来标识。

数据挖掘研究院

       数据挖掘论坛

       规范的HTTP URL形式可通过将主机中的大写字符转换成小写(主机名是大小写敏感的)来获得。如果端口是80,去掉冒号及端口号,并将空路径替换成“/”。 数据挖掘实验室

  数据挖掘工具

3.3  Date/Time 格式(Date/Time Formats

  数据挖掘研究院

       出于历史原因,HTTP/1.0应用允许三种格式来表示时间戳: 数据挖掘交友

  数据挖掘研究院

       Sun, 06 Nov 1994 08:49:37 GMT    ; RFC 822, updated by RFC 1123

       Sunday, 06-Nov-94 08:49:37 GMT   ; RFC 850, obsoleted by RFC 1036 数据挖掘交友

       Sun Nov  6 08:49:37 1994         ; ANSI C"s asctime() format 数据挖掘论坛

 

数据挖掘研究院

 

  数据挖掘实验室

 

 

数据挖掘实验室

 

 

  数据挖掘论坛

 

Berners-Lee, et al           Informational                     [Page 15]


  数据挖掘论坛

       第一种格式是首选的Internet标准格式,表示方法长度固定(RFC1123[6])。第二种格式在普通情况下使用,但是它是基于已经废弃的RFC850[10]中的日期格式,而且年不是用四位数字表示的。HTTP/1.0 客户端及服务器端在解析日期时可识别全部三种格式,但是它们不可以产生第三种时间格式(asctime) 数据挖掘实验室

       注意:对于接收到由非HTTP应用产生的日期数据时,提倡对接收到的日期值进行填充。这样做是因为,在某些时候,代理或网关可能通过SMTPNNTP来获取或发送消息。

数据挖掘论坛

       所有的HTTP/1.0 date/timp时间戳必须用世界时间(Universal TimeUT),即格林威治时间来表示(Greenwich Mean TimeGMT),没有任何修改的余地。前面的两种格式用了“GMT”表示时区,在读ASC表示的时间时,也应假定是这个时区。

数据挖掘论坛

 

HTTP-date = rfc1123-date | rfc850-date | asctime-date

数据挖掘实验室

 

rfc1123-date     = wkday "," SP date1 SP time SP "GMT" 数据挖掘交友

rfc850-date       = weekday "," SP date2 SP time SP "GMT" 数据挖掘论坛

asctime-date      = wkday SP date3 SP time SP 4DIGIT

date1              = 2DIGIT SP month SP 4DIGIT 数据挖掘实验室

                     ; day month year (e.g., 02 Jun 1982)

date2              = 2DIGIT "-" month "-" 2DIGIT

                      ; day-month-year (e.g., 02-Jun-82)

数据挖掘论坛

date3              = month SP ( 2DIGIT | ( SP 1DIGIT ))

                      ; month day (e.g., Jun  2)

time               = 2DIGIT ":" 2DIGIT ":" 2DIGIT

数据挖掘研究院

                      ; 00:00:00 - 23:59:59

数据挖掘工具

wkday              = "Mon" | "Tue" | "Wed"

数据挖掘工具

                      | "Thu" | "Fri" | "Sat" | "Sun" 数据挖掘工具

weekday           = "Monday" | "Tuesday" | "Wednesday"

                      | "Thursday" | "Friday" | "Saturday" | "Sunday"

month              = "Jan" | "Feb" | "Mar" | "Apr"

数据挖掘实验室

                      | "May" | "Jun" | "Jul" | "Aug"

数据挖掘研究院

                      | "Sep" | "Oct" | "Nov" | "Dec" 数据挖掘工具

注意:HTTP要求只能在协议流中使用data/time时间戳格式,不要求客户端及服务器端在用户描述、请求登录等情况下使用这类格式。

数据挖掘工具

  数据挖掘实验室

 

数据挖掘实验室

  数据挖掘交友

  数据挖掘论坛

 

数据挖掘实验室

 

  数据挖掘交友

  数据挖掘工具

 

  数据挖掘工具

  数据挖掘论坛

  数据挖掘实验室

Berners-Lee, et al           Informational                     [Page 16]


3.4  字符集(Character Sets

  数据挖掘实验室

       HTTP所使用的字符集定义和描述MIME时用的相同: 数据挖掘工具

本文档用字符集(character set)来指明利用一个或多个表将顺序字节转换成顺序字符的方法。注意,不需要其它方向的无条件转换,因为不是所有的字符都可以用给定字符集来表示,同时,一个字符集也可能提供一种以上的字节顺序来表示一种特殊的字符。这种定义倾向于允许不同类型的字符编码通过简单的单表映射来实现,如,从表US-ASCII切换到复杂表如ISO2202。实际上,与MIME字符集名相关的定义必须完整指定从字节到字符的映射,特别是不允许通过利用外部配置信息来确定精确的映射。

数据挖掘工具

  数据挖掘研究院

注意:术语字符集(character set)归于字符编码(character encoding)。事实上,由于HTTPMIME共同使用同样的注册,所以其术语也应一致。

数据挖掘交友

              数据挖掘论坛

HTTP字符集由大小写敏感的符号组成。全部的符号定义参见IANA字符集注册[15]。因为注册处不会为每个字符集单独定义一套符号,所以我们在这看到的字符集名大多是与HTTP实体使用相关的。这些在RFC 1521 [5] 中注册的字符集,即US-ASCII [17] ISO-8859 [18]字符集,还有一些其它字符集被强烈建议在MIME字符集参数内部使用。

数据挖掘研究院

 

数据挖掘工具

charset = "US-ASCII" 数据挖掘研究院

             | "ISO-8859-1" | "ISO-8859-2" | "ISO-8859-3"

             | "ISO-8859-4" | "ISO-8859-5" | "ISO-8859-6" 数据挖掘论坛

             | "ISO-8859-7" | "ISO-8859-8" | "ISO-8859-9"

             | "ISO-2022-JP" | "ISO-2022-JP-2" | "ISO-2022-KR" 数据挖掘实验室

             | "UNICODE-1-1" | "UNICODE-1-1-UTF-7" | "UNICODE-1-1-UTF-8" 数据挖掘交友

             | token

数据挖掘实验室

              数据挖掘工具

虽然HTTP允许使用专用符号做为字符集值,但是任何在IANA字符集注册表[15]中有预定义值的符号都必须表明其所属的字符集。应用应当将其对字符集的使用限制在IANA注册表规定的范围之内。

  数据挖掘论坛

  数据挖掘实验室

  数据挖掘实验室

  数据挖掘研究院

  数据挖掘论坛

  数据挖掘工具

 

  数据挖掘论坛

 

  数据挖掘交友

  数据挖掘研究院

 

数据挖掘实验室

 

数据挖掘交友

  数据挖掘实验室

Berners-Lee, et al           Informational                     [Page 17]


  数据挖掘实验室

实体主体的字符集如果属于US-ASCII ISO-8859-1字符集,则勿需标记,否则,应当用主体字符编码方式中的最基本命名来标记。 数据挖掘论坛

 

数据挖掘实验室

3.5  内容译码(Content Codings 数据挖掘研究院

       内容译码值用于指示对资源进行的编码转换。内容译码主要用于将经过压缩、加密等操作的文件进行还原,使其保持其原来的介质类型。典型情况下,经过编码保存的资源只能经过解码或类似的操作才能还原。 数据挖掘实验室

content-coding = "x-gzip" | "x-compress" | token

       注意:出于对未来兼容性的考虑,HTTP/1.0应用应将"gzip" "compress" 分别与 "x-gzip""x-compress"对应起来。

数据挖掘交友

       所有的内容译码值都是大小写敏感的。HTTP/1.0在内容编码(10.3节)头域中使用内容译码值。虽然该值描述的是内容译码,但更为重要的是,它指明了应当用什么机制来进行解码。注意,单独的程序可能有能力实现对多种格式编码的解码。

       在这段文字中,提到了两个值: 数据挖掘论坛

x-gzip

数据挖掘研究院

文件压缩程序"gzip" (GNU zip,由Jean-loup Gailly开发)的编码格式。该格式属于典型的带有32CRC 校验的Lempel-Ziv译码 (LZ77)

数据挖掘研究院

x-compress 数据挖掘论坛

文件压缩程序"compress"的编码格式,该格式适用于LZWLempel-Ziv-Welch)译码。 数据挖掘工具

注意:用程序名来标识编码格式的做法不是很理想,在将来可能不会继续这样做。现在之所以这样做是出于历史的原因,并非良好的设计。 数据挖掘交友

  数据挖掘研究院

 

 

 

 

数据挖掘研究院

 

数据挖掘实验室

  数据挖掘工具

 

数据挖掘交友

  数据挖掘工具

  数据挖掘交友

 

数据挖掘论坛

 

数据挖掘研究院

 

  数据挖掘论坛

 

数据挖掘论坛

  数据挖掘论坛

  数据挖掘实验室

 

 

 

  数据挖掘研究院

Berners-Lee, et al           Informational                     [Page 18] 数据挖掘交友


  数据挖掘研究院

3.6  介质类型(Media Types 数据挖掘研究院

  数据挖掘工具

       HTTPContent-Type header域(10.5节)中使用Internet介质类型[13],用以提供开放的可扩展的数据类型。 数据挖掘论坛

media-type        = type "/" subtype *( ";" parameter ) 数据挖掘研究院

type                      = token

subtype                    = token

 

       参数可参照属性/值对的方式,用类型/子类型的格式来写。 数据挖掘研究院

 

数据挖掘工具

Parameter         = attribute "=" value

数据挖掘论坛

Attribute                   = token

Value                     = token | quoted-string

数据挖掘论坛

 

数据挖掘研究院

       其中,类型、子类型、参数属性名是大小写敏感的。而参数值不一定是大小写敏感的,这得看参数名的语法而定。在类型和子类型、属性名和属性值之间不能有LWS(空格)。当接收到不能识别的介质类型的参数时,用户代理应当忽略它们。 数据挖掘工具

       一些老的HTTP应用不能识别介质类型参数,所以HTTP/1.0的应用程序只能在定义消息内容时使用介质参数。 数据挖掘论坛

       介质参数(Media-type)值用Internet授权分配数字(Internet Assigned Number   Authority IANA [15])注册。介质类型注册过程请参见RFC1590[13]。不鼓励使用未注册的介质类型。

  数据挖掘工具

3.6.1标准及文本缺省(Canonicalization and Text Defaults

[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:rfc1945
下一篇:Win32环境下动态链接库(DLL)编程原理
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • Internet控制信息协议(ICMP)
  • 微软公司软件开发模式简介
  • http1.1
  • TCP协议规范(中文版)
  • linux端口列表
  • 语音识别进入IVR系统
  • Api函数列表——与文件相关
  • RVP:存在和即时消息传送协议(3)
  • Win32环境下动态链接库(DLL)编程原理
  • PPPInternet协议控制协议(中文版)
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • Internet控制信息协议(ICMP)
  • 中文RFC文档远程COM选项(四)
  • Api函数列表——与文件相关
  • RVP:存在和即时消息传送协议(3)
  • 微软公司软件开发模式简介
  • MMXInstructions
  • TCP协议规范(中文版)
  • PPPInternet协议控制协议(中文版)
  • 语音识别进入IVR系统
  • http1.1
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静