早在 2004 年,Tim Bray, Nick Bradbury 和 Mark Pilgrim 这几位大牛就有过一场著名的口水战,围绕着客户端是否应该接受不 valid 的 XML (XHTML) 而展开,这场口水战以 Mark Pilgrim 的一篇堪称经典的 Thought Experiment 而告结束。Mark 举的一个例子就是页面本来是完全 valid 的,但别人发来了一个 trackback,其中包含了非法的字符,导致整个页面都无法通过校验。
时至今日,一年半过去了,乱码的 trackback 仍然随处可见,我们的 blog 工具版本号一升再升,难道就是解决不了这个问题?
为什么要解决这个问题?
有人会问,为什么要解决这种问题呢?人人都用 UTF-8 不就好了么?没错,在一个理想的世界里,UTF-8 解决了一切问题。问题在于,在一个理想的世界里,M$ 不是坏蛋,IE 还支持 CSS 3 呢!所以我们不能依靠这种白日梦。踏实一点来看,我们现在生活的世界情况是这样的:Apache 占据了大部分的市场,PHP 和 Perl 是两种主要的 Web 脚本语言——尤其对 Blog 而言,MySQL 是大部分开源 Web 程序使用的数据库,可是主机服务上还往往不如人意,大部分的用户不能自如的指定自己 Blog 使用的字符编码,转换 MySQL 存储数据的编码也不是天天没事就能转来转去玩儿的。
这个环境,说明我们应该对他人的页面使用的编码宽容一些。
这个问题理应如何解决
Trackback 不是一个标准,更没有标准化组织进行维护,它只是 MovableType 中发明的一种格式,最权威的说明,就是这篇 [...]
又一个基于 CSS 的阴影效果,这次来自 6A Pronet。
IE 有保留的 HTML id 值?Jason 在编辑 ALA 的一篇文章时发现这个问题,Eric Meyer 作了进一步的研究。
Matt 在讨论如何防止跨站脚本攻击的问题,有人给出了 Chris Shiflett 的一篇文章: Foiling Cross-Site Attacks。
“TeX fonts are mess…”Ulrik Vieth 和 Taco Hoekwater 在 Euro TeX’99 的 presentation 中如是说。看到这行话的时候,Thunderbird 告诉我从 context 邮件列表发来了新邮件,正好是 Taco 回复我的一封,此时我正被郁闷的 afm2tfm 抓狂着。
或许生而迟钝,大概花了三四天的时间,我才把 TeX 字体的基本原理理清一个思路,原因很简单,没有哪篇文档愿意从头到尾说清楚,它们都只愿意把一小部分的内容说出来,而我的感觉正如刚刚打开了四十二章经的封皮,所不同之处只在于我不打算去找满清龙脉,只希望把 TeX 的字体从安装、到使用,直到最后生成一份可打印的文档这整个过程了解清楚。
当然下面要说的也只是一个简化以后的细节,我这里一不涉及中文的使用,二不涉及 PDF,三不涉及 plain TeX 和 LaTeX 以外的格式。但只要我涉及的部分,就尽量不删减任何过程。
下面的叙述中,我尽量给出一些可以实践的例子,当你发现某处你很希望实践,而我又没有给出例子,那你可以肯定一点:此文的作者确实是不懂这个。
字体是怎么来的
字体是怎么来的?一般而言,TeX 的字体是用 MetaFont 设计出来的,用 MetaFont 的语言描写曲线和点划,这些描述保存在 .mf 文件中,通过 MetaFont 生成 GF 格式,GF 即 Generic Font 的缩写。尔后你通过一个叫做 gftopk 的工具,生成一种叫做 PK 的格式 (packed font),这种 PK 字体是基于 MetaFont [...]
© jjgod / blog. Powered by WordPress using the DePo Skinny Theme.