ISO/IEC 8859-1


ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母及符号,藉以供使用附加符号的拉丁字母语言使用。曾推出过 ISO 8859-1:1987 版。


ISO-8859-1的别名有: iso-ir-100, csISOLatin1, latin1, l1, IBM819. Oracle数据库称WE8ISO8859P1[1]




目录





  • 1 与Windows-1252的区别


  • 2 与ISO/IEC 10646即Unicode的关系


  • 3 适用语言


  • 4 字符集


  • 5 参看


  • 6 參考資料


  • 7 外部链接




与Windows-1252的区别


互联网上,常见把Windows-1252编码的文本误标称为ISO-8859-1,最常见后果是引号与撇号‘ ’ “ ” 在非Windows环境下被当作不识别字符显示为问号或方块(boxes)字符。大部分现代网页浏览器与e-mail客户端把互联网媒体类型字符集为ISO-8859-1当作Windows-1252来处理。HTML5标准要求把宣称为ISO-8859-1的文本当作Windows-1252编码来解析。[2]


截至2017年10月 (2017-10)[update], 4.5%声明是ISO 8859-1编码。[3]这包含了未知数量的实际上是Windows-1252或UTF-8编码的网页弹常被浏览器识别为ISO 8859-1编码。




ISO-8859-1与Windows-1252代码页的区别是:码位128至159(十六进制80至9F)原本是罕用的C1控制字符编码范围,被替换为额外的一些常用但未包含在ISO-8859-1中的字符。实际上Windows-1252代码页包含了所有出现在ISO-8859-15中的字符。ISO-8859-1对应的Windows代码页是Windows-28591[4]然而,英文版的Windows 7、Windows10家庭中文版 系统上没有Windows-28591代码页。



与ISO/IEC 10646即Unicode的关系


ISO-8859-1对应于ISO/IEC 10646即Unicode的前256个码位。



适用语言


此字符集支持部分于欧洲使用的语言,包括阿尔巴尼亚语、巴斯克语、布列塔尼语、加泰罗尼亚语、丹麦语、荷兰语、法罗语、弗里西语、加利西亚语、德语、格陵兰语、冰岛语、爱尔兰盖尔语、意大利语、拉丁语、卢森堡语、挪威语、葡萄牙语、里托罗曼斯语、苏格兰盖尔语、西班牙语及瑞典语。


英语虽然没有重音字母,但仍会标明为ISO/IEC 8859-1编码。除此之外,欧洲以外的部分语言,如南非荷兰语、斯瓦希里语、印尼语及马来语、菲律宾他加洛语等也可使用ISO/IEC 8859-1编码。


法语及芬兰语本来也使用ISO/IEC 8859-1来表示。但因它没有法语使用的 œ、Œ、Ÿ 三个字母及芬兰语使用的 Š、š、Ž、ž ,故于1998年被ISO/IEC 8859-15所取代。(ISO 8859-15同时加入了欧元符号)



字符集







































































































































































































































ISO/IEC 8859-1
 
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0x
 
1x
 
2x
SP!"#$%&'()*+,-./
3x
0123456789:;<=>?
4x
@ABCDEFGHIJKLMNO
5x
PQRSTUVWXYZ[]^_
6x
`abcdefghijklmno
7x
pqrstuvwxyz~ 
8x
 
9x
 
Ax
NBSP¡¢£¤¥¦§¨©ª«¬SHY®¯
Bx
°±²³´µ·¸¹º»¼½¾¿
Cx
ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎ
Ï
Dx
ÐÑÒÓÔÕÖרÙÚÛÜÝÞ
ß
Ex
àáâãäåæçèéêëìíî
ï
Fx
ðñòóôõö÷øùúûüýþ
ÿ

在上表中,0x20是空格、0xA0是不换行空格、0xAD是选择性连接号。


0x00-0x1F、0x7F、0x80-0x9F在此字符集中未有定义。(控制字符是由ISO/IEC 6429定义)。



参看


  • ASCII

  • ISO/IEC 646


  • ISO/IEC 8859 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 -13 -14 -15 -16


參考資料




  1. ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Law, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie. Appendix A: Locale Data. Oracle9i Database Globalization Support Guide (PDF) Release 2 (9.2). Oracle Corporation. 2002 [1996] [2017-02-14]. Oracle A96529-01. (原始内容存档 (PDF)于2017-02-14). 


  2. ^ Encoding. WHATWG. sec. 5.2 Names and labels. 27 January 2015 [4 February 2015]. (原始内容存档于4 February 2015). 


  3. ^ Historical trends in the usage of character encodings, October 2016. [2017-10-24]. 


  4. ^ Code Page Identifiers. Microsoft Corporation. [2010-12-19]. 



外部链接


  • 到国际标准化组织购买此标准


  • ISO/IEC 8859-1:1998 - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998)


  • Standard ECMA-94:8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)


  • ISO-IR 100 Right-Hand Part of Latin Alphabet No.1 (February 1, 1986)


  • 中國國家標準(中華民國)CNS 13246[永久失效連結]


Popular posts from this blog

27

Top Tejano songwriter Luis Silva dead of heart attack at 64

Category:Rhetoric