免费的HTML5连载来了《HTML5网页开发实例详解》连载(三)DOCTYPE和字符集

     在2.1.2节中通过新老DOCTYPE的对比,读者可以清晰地看到HTML 5在精简旧有结构上做出的努力。DOCTYPE在出现之初主要用于XML中,用作描述XML允许使用的元素、属性和排列方式。起初HTML借鉴了XML中DOCTYPE的使用方法,并赋予了新用法,如大家熟知的触发浏览器的标准模式。假使在制作一张页面时,没有设定DOCTYPE,则浏览器会以怪异模式状态进行处理(即Quirks模式),该模式与标准模式在盒模型、样式、布局等都存在较大差异。因此,DOCTYPE在制作页面时是不可或缺的部分。

在上一版本HTML 4标准中,DOCTYPE被分为3种模式:


  • 严格模式,即严格遵循W3C标准的模式,代码格式如下:

  1. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">  


  • 过渡模式,包含了W3C标准的内容,同时还可以使用不被W3C推荐的标签,如font、b等,而且不可以使用框架元素(即frameset元素),代码格式如下:

  1. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML4.01 Transitional//EN""http://www.w3.org/TR/html4/loose.dtd">  


  • 框架模式,可以使用框架元素,其他与过渡模式相同,代码格式如下:

  1. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">  




    提示:旧有的HTML关于DOCTYPE标准,读者可以参看W3C官方文档说明,网页地址:http://www.w3.org/TR/1999/REC-html401-19991224/struct/global.html#h-7.2。虽然之前版本的HTML对DOCTYPE做了重重规定,但真实情况却是浏览器会尽最大的可能渲染对应的页面,即使可能出现了一些不符合模式的做法,唯一会出现的是浏览器会在控制台中显示一些错误警告,这种做法就是常说的浏览器容错性,实则是对市场和用户的妥协。

    故事发展到HTML 5,W3C将DOCTYPE剔除原有鸡肋的声明方式,简化为如下格式:

  1. <!DOCTYPE html>  

   对于绝大多数开发者来说,只需要使用这一种方式就足以满足日常的开发使用,但如果要考虑到日后的兼容和扩展等一系列问题,还需要了解W3C在新制定DOCTYPE的一些新规定,主要分为3类:

  • 普通模式,即<!DOCTYPE html>

  • 弃用模式,听起来不知所云,其实指的就是对过往模式的兼容模式,不过HTML5弃用了之前的过渡模式和框架模式,最终留下了6种书写格式,代码如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.0//EN">

  1. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.0//EN" "http://www.w3.org/TR/REC-html40/strict.dtd">  

  2. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.01//EN">  

  3. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">  

  4. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML1.0 Strict//EN"  

  5.          "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">  

  6. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">  


  • 遗留兼容模式,对于过往无法考证规则的一种兼容方式,语法格式如下:

  1. <!doctype HTML system"about:legacy-compat">  


    通过对浏览器DOCTYPE的理解,读者可以熟悉浏览器模式的触发方式,不过就通常开发而言,只需要使用<!DOCTYPEhtml>这一种普通模式。

提示:HTML 5最新3种模式可以查看链接http://dev.w3.org/html5/markup/syntax.html#doctype-syntax

        所谓的字符是对各种文字和符号的总称,涵盖了各国文字、标点符号、图形符号和数字等。字符集是对多个字符的集合,常用的字符集有:ASCII、GB2312、Unicode、ISO等。科学家为了让计算机准确地处理各种字符集,需要对字符进行编码,以便计算机能够识别和存储各种文字。

        在HTML 5出现之前,浏览器会根据3种方式确认页面的编码格式,按优先级排列如下:


  • 获取HTTP请求头中的Content-Type字符对应的值。

  • 使用meta标签声明,语法格式如下:

  1. <meta http-equiv="Content-Type"content="text/html; charset=utf-8">  



  • 外链资源使用charset属性声明编码格式,如script标签中使用语法格式如下:


  1. <script type="text/javascript"src="myscripts.js" charset="UTF-8"></script>  


HTML 5出现后,对字符集的使用做了大量的简化,可以使用以下语法进行字符集声明:copy

  1. <meta charset="utf-8">  


对于日常使用网站开发而言,结合HTML 5的字符集使用,笔者给出如下建议:


  •  最优先使用HTTP请求头指定编码。

  •  统一全站字符集编码,HTML 5推荐UTF-8字符集。

  • 使用meta标签确认字符集编码,尽可能放在html标签的第一个子元素位置。

  • 第三方引用的脚本,在不确认字符编码时,加上charset属性设置编码格式。


学习HTML5最好的书就是《HTML5网页开发实例详解》,用代码学习用案例学习,可比看文字有趣多了!!!一本书搞定HTML5,从现在开始。


免费的HTML5连载来了《HTML5网页开发实例详解》连载(三)DOCTYPE和字符集,古老的榕树,5-wow.com

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。