资讯详情

UTF-8,Unicode,GBK,希腊字母读法,ASCII码表,HTTP错误码,URL编码表,HTML特殊字符,汉字编码简明对照表...

UNICODE,GBK,UTF-8区别

UNICODE,GBK,UTF-8区别简单来说,unicode,gbk和大五码是编码值,utf-8,uft-16是这个值的表现形式。前三种代码是兼容的,同一个汉字,三种代码值完全不同。uncode值与gbk假设不同uncode为a040,gbk为b030,而uft-8码是表达值的形式。utf-完全只针对8码uncode如果GBK想转UTF-8,必须先转uncode码,再转utf-8就OK了.详见下面转的文章。谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词这是程序员写给程序员的一本有趣的书。所谓兴趣,就是很容易理解一些不清楚的概念,提高知识,类似于玩RPG游戏升级。本文的动机有两个问题:问题一:使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicodebigendian和UTF-这些编码方法相互转换。txt文件,Windows如何识别编码?很久以前就发现了Unicode、Unicodebigendian和UTF-8编码的txt文件开头会有几个字节,分别是FF、FE(Unicode),FE、FF(Unicodebigendian),EF、BB、BF(UTF-8)。但是这些标记是基于什么标准的呢?问题二:最近在网上看到一个ConvertUTF.c,实现了UTF-32、UTF-16和UTF-这三种编码方法的相互转换。Unicode(UCS2)、GBK、UTF-我知道这些编码方法。但是这个程序让我有点困惑,我记不起来了。UTF-16和UCS关系是什么?查了相关资料,终于把这些问题搞清楚了,顺便了解了一些Unicode细节。给有类似问题的朋友写一篇文章。这篇文章在写作时尽量通俗易懂,但要求读者知道什么是字节,什么是十六进制。0、bigendian和littleendianbigendian和littleendian是CPU处理多字节数的不同方法。比如汉字Unicode编码是6C49。所以写文件的时候,是6吗?C写在前面,还是在前面写49?如果将6C写在前面,就是bigendian。如果把49写在前面,那就是littleendian。“endian这个词来自格列佛游记。小人国的内战源于吃鸡蛋时的大头(Big-Endian)敲开还是从小头(Little-Endian)敲开,发生了六次叛乱,一个皇帝死了,另一个失去了王位。我们一般将endian翻译成字节序bigendian和littleendian叫大尾和小尾。1.顺便介绍一下汉字编码和内码在计算机处理之前,必须编码字符。计算机使用的缺失编码方法是计算机的内码。早期的计算机使用7位ASCII编码,程序员理汉字,程序员设计了简体中文GB2312用于繁体中文big5。GB2312(1980年)共收录了7445个字符,包括6763个字符和682个其他符号。汉字区内码范围高B0-F7,低字节从A1-FE,占用的码位为72*94=6768。五个空间是D7FA-D7FE。GB2312支持的汉字太少。1995年汉字扩展规范GBK1.包括21886个符号,分为汉字区和图形符号区。汉字区包括21003个字符。从ASCII、GB2312到GBK,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,以下标准支持更多的字符。在这些编码中,英语和中文可以统一处理。区分中文编码的方法是高字节的最高水平不是0。根据程序员的名字,GB2312、GBK都属于双字节字符集(DBCS)。2000年的GB18030是取代GBK1.正式的国家标准0。该标准包含27484个汉字,以及藏文、蒙文、维吾尔文等主要少数民族文字。从汉字字汇来看,GB18030在GB13000.在20902个汉字的基础上增加了1个汉字CJK6582个汉字扩展A(Unicode码0x3400-0x4db5)共有27484个汉字。CJK意思是中日韩。Unicode统一编码中日韩语言中的文字,以节省码位。GB13000.1就是ISO/IEC中文版10646-1相当于Unicode1.1。GB单字节、双字节采用单字节、双字节和4字节方案。单字节、双字节和GBK它完全兼容。包含了4字节编码的码位CJK6582个汉字扩展A。UCS的0x3400在GB8139应该是18030中的编码EF30,UCS的0x3401在GB8139应该是18030中的编码EF31。微软提供了GB18030升级包,但这个升级包只提供了一套支持CJK6582个汉字的新字体扩展A:新宋体-18030,内码不变。Windows内码仍然是GBK。还有一些细节:GB2312的原文仍然是区位码,从区位码到内码,需要在高字节和低字节上分别添加A0。对于任何字符编码,编码单元的顺序由编码方案指定endian无关。例如GBK编码单元为字节,用两个字节表示汉字。这两个字节的顺序是固定的,不受影响CPU字节序的影响。UTF-16编码单元是word(双字节),word编码方案指定了之间的顺序,word内部的字节排列会受到影响endian的影响。以后再介绍UTF-16。GB2312字节的最高位为1。但符合这一条件的码位只有128*128=16384个。所以GBK和GB低字节18030的最高水平可能不是1。但这并不影响DBCS字符流分析:读取DBCS在字符流中,只要遇到高位为1的字节,就可以将下两个字节作为双字节编码,而不管低字节的高位是什么。2、Unicode、UCS和UTF前面提到从ASCII、GB2312、GBK到GB18030的编码方法是向下兼容的。Unicode只与ASCII兼容性(更准确地说,是与ISO-8859-1兼容),与GB代码不兼容。比如汉字Unicode编码是6C49,而GB码是BABA。Unicode它也是一种字符编码方法,但它是由国际组织设计的,可以容纳世界上所有语言文本的编码方案。Unicode的学名是"UniversalMultiple-OctetCodedCharacterSet",简称为UCS。UCS可以看作是"UnicodeCharacterSet"的缩写。根据维基百科全书(http://zh.wikipedia.org/wiki/)记录:历史上有两次试图独立设计Unicode组织,即国际标准化组织(ISO)与软件制造商协会(unicode.org)。ISO开发了ISO10646项目,Unicode协会开发了Unicode项目。1991年左右,双方都意识到世界不需要两个不兼容的字符集。于是他们开始合并双方的工作成果,合作创建一个单一的代码表。Unicode2.0开始,Unicode项目采用和ISO10646-1字库和字码相同。这两个项目仍然存在,并独立公布各自的标准。Unicode现在协会的最新版本是2005年Unicode4.1.0。ISO最新标准是ISO10646-3:2003。UCS只规定如何编码,不规定如何传输和保存编码。比如汉字UCS编码是6C49,我可以用4个ascii这个编码也可以用来传输和保存数字;utf-8编码:3个连续字节E6B189来表示它。关键是通信双方都要认可。UTF-8、UTF-7、UTF-16广泛接受的方案。UTF-8的一个特殊好处是它和ISO-8859-1完全兼容。UTF是“UCSTransformationFormat”的缩写。IETF的RFC2781和RFC3629以RFC一贯的风格,清晰、活泼、严谨地描述UTF-16和UTF-8编码方法。我总是不记得了IETF是InternetEngineeringTaskForce的缩写。但IETF负责维护的RFC是Internet所有规范的基础。2.1、内码和codepage目前Windows的内核已经支持Unicode字符集可以在核心上支持世界上所有的语言文本。然而,由于大量现有的程序和文档使用特定语言的编码,例如GBK,Windows不支持现有编码是不可能的,所有编码都被重用Unicode。Windows使用代码页(codepage)适应各国和地区。codepage可理解为上述内码。GBK对应的codepage是CP936。微软也为GB18030定义了codepage:CP54936。但是由于GB18030有一部分4字节编码,Windows代码页只支持单字节和双字节编码,所以这个codepage它不能真正使用。3、UCS-2、UCS-4、BMPUCS有两种格式:UCS-2和UCS-4.顾名思义,UCS-二是用两个字节编码,UCS-4是用4个字节编码(其实只用31个字节,最高必须是0)。让我们玩一些简单的数学游戏:UCS-2有2^16=65536个码位,UCS-4有2^31=2147483648个码位。UCS-4根据最高位为0的最高字节分为2^7=128个group。每个group次高字节分为256个plane。每个plane第三个字节分为256行(rows),每行包含256个cells。当然,同行cells只是最后一个字节不一样,剩下的都一样。group0的plane0被称作BasicMultilingualPlane,即BMP。或者说UCS-四个字节为0的高码被称为BMP。将UCS-4的BMP去掉前两个零字节。UCS-2。UCS-2的两个字节前加上两个零字节,就得到了UCS-4的BMP。而目前的UCS-4规范中还没有任何字符被分配在BMP之外。4、UTF编码UTF-8就是以8位为单元对UCS进行编码。从UCS-2到UTF-8的编码方式如下:UCS-2编码(16进制) UTF-8 字节流(二进制)0000 - 007F 0xxxxxxx0080 - 07FF 110xxxxx 10xxxxxx0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以肯定要用3字节模板了:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 110001 001001,用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。读者可以用记事本测试一下我们的编码是否正确。需要注意,UltraEdit在打开utf-8编码的文本文件时会自动转换为UTF-16,可能产生混淆。你可以在设置中关掉这个选项。更好的工具是Hex Workshop。UTF-16以16位为单元对UCS进行编码。对于小于0x10000的UCS码,UTF-16编码就等于UCS码对应的16位无符号整数。对于不小于0x10000的UCS码,定义了一个算法。不过由于实际使用的UCS2,或者UCS4的BMP必然小于0x10000,所以就目前而言,可以认为UTF-16和UCS-2基本相同。但UCS-2只是一个编码方案,UTF-16却要用于实际的传输,所以就不得不考虑字节序的问题。5、UTF的字节序和BOMUTF-8以字节为编码单元,没有字节序的问题。UTF-16以两个字节为编码单元,在解释一个UTF-16文本前,首先要弄清楚每个编码单元的字节序。例如“奎”的Unicode编码是594E,“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”,那么这是“奎”还是“乙”?Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是“Bill Of Material”的BOM表,而是Byte order Mark。BOM是一个有点小聪明的想法:在UCS编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF(读者可以用我们前面介绍的编码方法验证一下)。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。Windows就是使用BOM来标记文本文件的编码方式的。6、进一步的参考资料本文主要参考的资料是 "Short overview of ISO-IEC 10646 and Unicode" (http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html)。我还找了两篇看上去不错的资料,不过因为我开始的疑问都找到了答案,所以就没有看:"Understanding Unicode A general introduction to the Unicode Standard" (http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter04a)"Character set encoding basics Understanding character set encodings and legacy encodings" (http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter03)我写过UTF-8、UCS-2、GBK相互转换的软件包,包括使用Windows API和不使用Windows API的版本。以后有时间的话,我会整理一下放到我的个人主页上(http://fmddlmyy.home4u.china.com)。我是想清楚所有问题后才开始写这篇文章的,原以为一会儿就能写好。没想到考虑措辞和查证细节花费了很长时间,竟然从下午1:30写到9:00。希望有读者能从中受益。附录1 再说说区位码、GB2312、内码和代码页有的朋友对文章中这句话还有疑问:“GB2312的原文还是区位码,从区位码到内码,需要在高字节和低字节上分别加上A0。”我再详细解释一下:“GB2312的原文”是指国家1980年的一个标准《中华人民共和国国家标准信息交换用汉字编码字符集 基本集 GB 2312-80》。这个标准用两个数来编码汉字和中文符号。第一个数称为“区”,第二个数称为“位”。所以也称为区位码。1-9区是中文符号,16-55区是一级汉字,56-87区是二级汉字。现在Windows也还有区位输入法,例如输入1601得到“啊”。(这个区位输入法可以自动识别16进制的GB2312和10进制的区位码,也就是说输入B0A1同样会得到“啊”。)内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的。现在的Windows在系统内部支持Unicode,然后用代码页适应各种语言,“内码”的概念就比较模糊了。微软一般将缺省代码页指定的编码说成是内码。内码这个词汇,并没有什么官方的定义,代码页也只是微软这个公司的叫法。作为程序员,我们只要知道它们是什么东西,没有必要过多地考证这些名词。所谓代码页(code page)就是针对一种语言文字的字符编码。例如GBK的code page是CP936,BIG5的code page是CP950,GB2312的code page是CP20936。Windows中有缺省代码页的概念,即缺省用什么编码来解释字符。例如Windows的记事本打开了一个文本文件,里面的内容是字节流:BA、BA、D7、D6。Windows应该去怎么解释它呢?是按照Unicode编码解释、还是按照GBK解释、还是按照BIG5解释,还是按照ISO8859-1去解释?如果按GBK去解释,就会得到“汉字”两个字。按照其它编码解释,可能找不到对应的字符,也可能找到错误的字符。所谓“错误”是指与文本作者的本意不符,这时就产生了乱码。答案是Windows按照当前的缺省代码页去解释文本文件里的字节流。缺省代码页可以通过控制面板的区域选项设置。记事本的另存为中有一项ANSI,其实就是按照缺省代码页的编码方法保存。Windows的内码是Unicode,它在技术上可以同时支持多个代码页。只要文件能说明自己使用什么编码,用户又安装了对应的代码页,Windows就能正确显示,例如在HTML文件中就可以指定charset。有的HTML文件作者,特别是英文作者,认为世界上所有人都使用英文,在文件中不指定charset。如果他使用了0x80-0xff之间的字符,中文Windows又按照缺省的GBK去解释,就会出现乱码。这时只要在这个html文件中加上指定charset的语句,例如:<meta http-equiv="Content-Type" content="text/html; charset=ISO8859-1">如果原作者使用的代码页和ISO8859-1兼容,就不会出现乱码了。再说区位码,啊的区位码是1601,写成16进制是0x10,0x01。这和计算机广泛使用的ASCII编码冲突。为了兼容00-7f的ASCII编码,我们在区位码的高、低字节上分别加上A0。这样“啊”的编码就成为B0A1。我们将加过两个A0的编码也称为GB2312编码,虽然GB2312的原文根本没提到这一点。

 

Α α alpha AL-fuh 
Β β beta BAY-tuh, BEE-tuh 
Γ γ gamma GAM-uh 
Δ δ delta DELL-tuh 
Ε ε epsilon EP-suh-lon 
Ζ ζ zeta ZAY-tuh, ZEE-tuh 
Η η eta AY-tuh (rhymes with BAY-tuh), EE-tuh 
Θ θ theta THAY-tuh, THEE-tuh (th as in thin) 
Ι ι iota eye-OH-tuh 
Κ κ kappa CAP-uh 
Λ λ lambda LAM-duh 
Μ μ mu MYOO, MOO 
Ν ν nu NOO, NYOO 
Ξ ξ xi ZIGH, SIGH, KSEE 
Ο ο omicron AH-mih-cron, OH-mih-cron 
Π π pi PIE 
Ρ ρ rho ROE 
Σ σ sigma SIG-muh 
Τ τ tau TOW (rhymes with cow), TAW 
Υ υ upsilon UP-suh-lon, YOOP-suh-lon 
Φ φ phi FIE, FEE 
Χ χ chi KIGH, KEE 
Ψ ψ psi SIGH, PSIGH, PSEE 
Ω ω omega oh-MEG-uh, oh-MEE-guh, oh-MAY-guh 
 

ASCII码表

GIF版
Decimal  Octal  Hex   Binary      Value
-------  -----  ---   ------      -----
  000    000    000   00000000    NUL  (Null char.)
  001    001    001   00000001    SOH  (Start of Header)
  002    002    002   00000010    STX  (Start of Text)
  003    003    003   00000011    ETX  (End of Text)
  004    004    004   00000100    EOT  (End of Transmission)
  005    005    005   00000101    ENQ  (Enquiry)
  006    006    006   00000110    ACK  (Acknowledgment)
  007    007    007   00000111    BEL  (Bell)
  008    010    008   00001000     BS  (Backspace)
  009    011    009   00001001     HT  (Horizontal Tab)
  010    012    00A   00001010     LF  (Line Feed)
  011    013    00B   00001011     VT  (Vertical Tab)
  012    014    00C   00001100     FF  (Form Feed)
  013    015    00D   00001101     CR  (Carriage Return)
  014    016    00E   00001110     SO  (Shift Out)
  015    017    00F   00001111     SI  (Shift In)
  016    020    010   00010000    DLE  (Data Link Escape)
  017    021    011   00010001    DC1  (XON) (Device Control 1)
  018    022    012   00010010    DC2      (Device Control 2)
  019    023    013   00010011    DC3  (XOFF)(Device Control 3)
  020    024    014   00010100    DC4      (Device Control 4)
  021    025    015   00010101    NAK  (Negative Acknowledgement)
  022    026    016   00010110    SYN  (Synchronous Idle)
  023    027    017   00010111    ETB  (End of Trans. Block)
  024    030    018   00011000    CAN  (Cancel)
  025    031    019   00011001     EM  (End of Medium)
  026    032    01A   00011010    SUB  (Substitute)
  027    033    01B   00011011    ESC  (Escape)
  028    034    01C   00011100     FS  (File Separator)
  029    035    01D   00011101     GS  (Group Separator)
  030    036    01E   00011110     RS  (Req to Send)(Rec Sep)
  031    037    01F   00011111     US  (Unit Separator)
  032    040    020   00100000     SP  (Space)
  033    041    021   00100001      !
  034    042    022   00100010      "
  035    043    023   00100011      #
  036    044    024   00100100      $
  037    045    025   00100101      %
  038    046    026   00100110      &
  039    047    027   00100111      '
  040    050    028   00101000      (
  041    051    029   00101001      )
  042    052    02A   00101010      *
  043    053    02B   00101011      +
  044    054    02C   00101100      ,
  045    055    02D   00101101      -
  046    056    02E   00101110      .
  047    057    02F   00101111      /
  048    060    030   00110000      0
  049    061    031   00110001      1
  050    062    032   00110010      2
  051    063    033   00110011      3
  052    064    034   00110100      4
  053    065    035   00110101      5
  054    066    036   00110110      6
  055    067    037   00110111      7
  056    070    038   00111000      8
  057    071    039   00111001      9
  058    072    03A   00111010      :
  059    073    03B   00111011      ;
  060    074    03C   00111100      <
  061    075    03D   00111101      =
  062    076    03E   00111110      >
  063    077    03F   00111111      ?
  064    100    040   01000000      @
  065    101    041   01000001      A
  066    102    042   01000010      B
  067    103    043   01000011      C
  068    104    044   01000100      D
  069    105    045   01000101      E
  070    106    046   01000110      F
  071    107    047   01000111      G
  072    110    048   01001000      H
  073    111    049   01001001      I
  074    112    04A   01001010      J
  075    113    04B   01001011      K
  076    114    04C   01001100      L
  077    115    04D   01001101      M
  078    116    04E   01001110      N
  079    117    04F   01001111      O
  080    120    050   01010000      P
  081    121    051   01010001      Q
  082    122    052   01010010      R
  083    123    053   01010011      S
  084    124    054   01010100      T
  085    125    055   01010101      U
  086    126    056   01010110      V
  087    127    057   01010111      W
  088    130    058   01011000      X
  089    131    059   01011001      Y
  090    132    05A   01011010      Z
  091    133    05B   01011011      [
  092    134    05C   01011100      \
  093    135    05D   01011101      ]
  094    136    05E   01011110      ^
  095    137    05F   01011111      _
  096    140    060   01100000      `
  097    141    061   01100001      a
  098    142    062   01100010      b
  099    143    063   01100011      c
  100    144    064   01100100      d
  101    145    065   01100101      e
  102    146    066   01100110      f
  103    147    067   01100111      g
  104    150    068   01101000      h
  105    151    069   01101001      i
  106    152    06A   01101010      j
  107    153    06B   01101011      k
  108    154    06C   01101100      l
  109    155    06D   01101101      m
  110    156    06E   01101110      n
  111    157    06F   01101111      o
  112    160    070   01110000      p
  113    161    071   01110001      q
  114    162    072   01110010      r
  115    163    073   01110011      s
  116    164    074   01110100      t
  117    165    075   01110101      u
  118    166    076   01110110      v
  119    167    077   01110111      w
  120    170    078   01111000      x
  121    171    079   01111001      y
  122    172    07A   01111010      z
  123    173    07B   01111011      {
  124    174    07C   01111100      |
  125    175    07D   01111101      }
  126    176    07E   01111110      ~
  127    177    07F   01111111    DEL
 

HTTP错误码

详细介绍参考
HTTP 2xx  成功  
HTTP 200  正常;请求已完成。  
HTTP 201  正常;紧接 POST 命令。  
HTTP 202  正常;已接受用于处理,但处理尚未完成。  
HTTP 203  正常;部分信息 — 返回的信息只是一部分。  
HTTP 204  正常;无响应 — 已接收请求,但不存在要回送的信息。  
HTTP 3xx  重定向  
HTTP 301  已移动 — 请求的数据具有新的位置且更改是永久的。  
HTTP 302  已找到 — 请求的数据临时具有不同 URI。  
HTTP 303  请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。  
HTTP 304  未修改 — 未按预期修改文档。  
HTTP 305  使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。  
HTTP 306  未使用 — 不再使用;保留此代码以便将来使用。  
HTTP 4xx  客户机中出现的错误  
HTTP 400  错误请求 — 请求中有语法问题,或不能满足请求。  
HTTP 401  未授权 — 未授权客户机访问数据。  
HTTP 401.1 - 未授权:登录失败 
HTTP 401.2 - 未授权:服务器配置问题导致登录失败 
HTTP 401.3 - ACL 禁止访问资源 
HTTP 401.4 - 未授权:授权被筛选器拒绝 
HTTP 401.5 - 未授权:ISAPI 或 CGI 授权失败  
HTTP 402  需要付款 — 表示计费系统已有效。  
HTTP 403 - 禁止访问 
HTTP 403 - 对 Internet 服务管理器 (HTML) 的访问仅限于 Localhost 
HTTP 403.1 禁止访问:禁止可执行访问 
HTTP 403.2 - 禁止访问:禁止读访问 
HTTP 403.3 - 禁止访问:禁止写访问 
HTTP 403.4 - 禁止访问:要求 SSL 
HTTP 403.5 - 禁止访问:要求 SSL 128 
HTTP 403.6 - 禁止访问:IP 地址被拒绝 
HTTP 403.7 - 禁止访问:要求客户证书 
HTTP 403.8 - 禁止访问:禁止站点访问 
HTTP 403.9 - 禁止访问:连接的用户过多 
HTTP 403.10 - 禁止访问:配置无效 
HTTP 403.11 - 禁止访问:密码更改 
HTTP 403.12 - 禁止访问:映射器拒绝访问 
HTTP 403.13 - 禁止访问:客户证书已被吊销 
HTTP 403.15 - 禁止访问:客户访问许可过多 
HTTP 403.16 - 禁止访问:客户证书不可信或者无效 
HTTP 403.17 - 禁止访问:客户证书已经到期或者尚未生效 
HTTP 404.1 - 无法找到 Web 站点 
HTTP 404 - 无法找到文件 
HTTP 405 - 资源被禁止 
HTTP 406 - 无法接受 
HTTP 407 - 要求代理身份验证 
HTTP 410 - 永远不可用 
HTTP 412 - 先决条件失败 
HTTP 414 - 请求 - URI 太长 
HTTP 415  介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。 
HTTP 5xx  服务器中出现的错误  
HTTP 500  内部错误 — 因为意外情况,服务器不能完成请求。  
HTTP 500.100 - 内部服务器错误 - ASP 错误 
HTTP 500-11 服务器关闭 
HTTP 500-12 应用程序重新启动 
HTTP 500-13 - 服务器太忙 
HTTP 500-14 - 应用程序无效 
HTTP 500-15 - 不允许请求 global.asa 
HTTP 501  未执行 — 服务器不支持请求的工具。  
HTTP 502  错误网关 — 服务器接收到来自上游服务器的无效响应。  
HTTP 503  无法获得服务 — 由于临时过载或维护,服务器无法处理请求。
 

URL编码表

backspace      %08
tab            %09
linefeed       %0A
creturn        %0D
space          %20
!              %21
"              %22
#              %23
$              %24
%              %25
&              %26
'              %27
(              %28
)              %29
*              %2A
+              %2B
,              %2C
-              %2D
.              %2E
/              %2F
0              %30
1              %31
2              %32
3              %33
4              %34
5              %35
6              %36
7              %37
8              %38
9              %39
:              %3A
;              %3B
<              %3C
=              %3D
>              %3E
?              %3F
@              %40
A              %41
B              %42
C              %43
D              %44
E              %45
F              %46
G              %47
H              %48
I              %49
J              %4A
K              %4B
L              %4C
M              %4D
N              %4E
O              %4F
P              %50
Q              %51
R              %52
S              %53
T              %54
U              %55
V              %56
W              %57
X              %58
Y              %59
Z              %5A
[              %5B
\              %5C
]              %5D
^              %5E
_              %5F
`              %60
a              %61
b              %62
c              %63
d              %64
e              %65
f              %66
g              %67
h              %68
i              %69
j              %6A
k              %6B
l              %6C
m              %6D
n              %6E
o              %6F
p              %70
q              %71
r              %72
s              %73
t              %74
u              %75
v              %76
w              %77
x              %78
y              %79
z              %7A
{              %7B
|              %7C
}              %7D
~              %7E
¢              %A2
£              %A3
¥              %A5
|              %A6
§              %A7
«              %AB
¬              %AC
¯              %AD
º              %B0
±              %B1
ª              %B2
,              %B4
µ              %B5
»              %BB
¼              %BC
½              %BD
¿              %BF
À              %C0
Á              %C1
              %C2
à             %C3
Ä              %C4
Å              %C5
Æ              %C6
Ç              %C7
È              %C8
É              %C9
Ê              %CA
Ë              %CB
Ì              %CC
Í              %CD
Î              %CE
Ï              %CF
Ð              %D0
Ñ              %D1
Ò              %D2
Ó              %D3
Ô              %D4
Õ              %D5
Ö              %D6
Ø              %D8
Ù              %D9
Ú              %DA
Û              %DB
Ü              %DC
Ý              %DD
Þ              %DE
ß              %DF
à              %E0
á              %E1
â              %E2
ã              %E3
ä              %E4
å              %E5
æ              %E6
ç              %E7
è              %E8
é              %E9
ê              %EA
ë              %EB
ì              %EC
í              %ED
î              %EE
ï              %EF
ð              %F0
ñ              %F1
ò              %F2
ó              %F3
ô              %F4
õ              %F5
ö              %F6
÷              %F7
ø              %F8
ù              %F9
ú              %FA
û              %FB
ü              %FC
ý              %FD
þ              %FE
ÿ              %FF
 

HTML特殊字符

标签: 50pin母端勾耳连接器m048dc2继电器继电器48403213继电器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台

left single quote   &lsquo;
right single quote   &rsquo;
single low-9 quote   &sbquo;
left double quote   &ldquo;
right double quote   &rdquo;
double low-9 quote   &bdquo;
dagger   &dagger;
double dagger   &Dagger;
per mill sign   &permil;
single left-pointing angle quote   &lsaquo;
single right-pointing angle quote   &rsaquo;
black spade suit   &spades;
black club suit   &clubs;
black heart suit   &hearts;
black diamond suit   &diams;
overline, = spacing overscore   &oline;
leftward arrow   &larr;
upward arrow   &uarr;
rightward arrow   &rarr;
downward arrow   &darr;
trademark sign &#x2122; &trade;
unused &#00;-&#08;    
horizontal tab &#09;    
line feed &#10;    
unused &#11;    
space &#32;    
exclamation mark &#33;  
double quotation mark &#34; &quot;
number sign &#35;  
dollar sign &#36;  
percent sign &#37;  
ampersand &#38; &amp;
apostrophe &#39;  
left parenthesis &#40;  
right parenthesis &#41;  
asterisk &#42;  
plus sign &#43;  
comma &#44;  
hyphen &#45;  
period &#46;  
slash &#47; &frasl;
digits 0-9 &#48;-&#57;    
colon &#58;  
semicolon &#59;  
less-than sign &#60; &lt;
equals sign &#61;  
greater-than sign &#62; &gt;
question mark &#63;  
at sign &#64;  
uppercase letters A-Z &#65;-&#90;    
left square bracket &#91;  
backslash &#92;  
right square bracket &#93;  
caret &#94;  
horizontal bar (underscore) &#95;  
grave accent &#96;  
lowercase letters a-z &#97;-&#122;    
left curly brace &#123;  
vertical bar &#124;  
right curly brace &#125;  
tilde &#126;  
unused &#127;-&#149;    
en dash &#150; &ndash;
em dash &#151; &mdash;
unused &#152;-&#159;    
nonbreaking space &#160; &nbsp;
inverted exclamation &#161; &iexcl;
cent sign &#162; &cent;
pound sterling &#163; &pound;
general currency sign &#164; &curren;
yen sign &#165; &yen;
broken vertical bar &#166; &brvbar; or &brkbar;
section sign &#167; &sect;
umlaut &#168; &uml; or &die;
copyright &#169; &copy;
feminine ordinal &#170; &ordf;
left angle quote &#171; &laquo;
not sign &#172; &not;
soft hyphen &#173; &shy;  
registered trademark &#174; &reg;
macron accent &#175; &macr; or &hibar;
degree sign &#176; &deg;
plus or minus &#177; &plusmn;
superscript two &#178; &sup2;
superscript three &#179; &sup3;
acute accent &#180; &acute;
micro sign &#181; &micro;
paragraph sign &#182; &para;
middle dot &#183; &middot;
cedilla &#184; &cedil;
superscript one &#185; &sup1;
masculine ordinal &#186; &ordm;
right angle quote &#187; &raquo;
one-fourth &#188; &frac14;
one-half &#189; &frac12;
three-fourths &#190; &frac34;
inverted question mark &#191; &iquest;
uppercase A, grave accent &#192; &Agrave;
uppercase A, acute accent &#193; &Aacute;
uppercase A, circumflex accent &#194; &Acirc;
uppercase A, tilde &#195; &Atilde;
uppercase A, umlaut &#196; &Auml;
uppercase A, ring &#197; &Aring;
uppercase AE &#198; &AElig;
uppercase C, cedilla &#199; &Ccedil;
uppercase E, grave accent &#200; &Egrave;
uppercase E, acute accent &#201; &Eacute;
uppercase E, circumflex accent &#202; &Ecirc;
uppercase E, umlaut &#203; &Euml;
uppercase I, grave accent &#204; &Igrave;
uppercase I, acute accent &#205; &Iacute;
uppercase I, circumflex accent &#206; &Icirc;
uppercase I, umlaut &#207; &Iuml;
uppercase Eth, Icelandic &#208; &ETH;
uppercase N, tilde &#209; &Ntilde;
uppercase O, grave accent &#210; &Ograve;
uppercase O, acute accent &#211; &Oacute;
uppercase O, circumflex accent &#212; &Ocirc;
uppercase O, tilde &#213; &Otilde;
uppercase O, umlaut &#214; &Ouml;
multiplication sign &#215; &times;
uppercase O, slash &#216; &Oslash;
uppercase U, grave accent &#217; &Ugrave;
uppercase U, acute accent &#218; &Uacute;
uppercase U, circumflex accent &#219; &Ucirc;
uppercase U, umlaut &#220; &Uuml;
uppercase Y, acute accent &#221; &Yacute;
uppercase THORN, Icelandic &#222; &THORN;
lowercase sharps, German &#223; &szlig;
lowercase a, grave accent &#224; &agrave;
lowercase a, acute accent &#225; &aacute;
lowercase a, circumflex accent &#226; &acirc;
lowercase a, tilde &#227; &atilde;
lowercase a, umlaut &#228; &auml;
lowercase a, ring &#229; &aring;
lowercase ae &#230; &aelig;
lowercase c, cedilla &#231; &ccedil;
lowercase e, grave accent &#232; &egrave;
lowercase e, acute accent &#233; &eacute;
lowercase e, circumflex accent &#234; &ecirc;
lowercase e, umlaut &#235; &euml;
lowercase i, grave accent &#236; &igrave;
lowercase i, acute accent &#237; &iacute;
lowercase i, circumflex accent &#238; &icirc;
lowercase i, umlaut &#239; &iuml;
lowercase eth, Icelandic &#240; &eth;