正则表达式学习笔记

本文是《正则表达式30分钟入门教程》的学习笔记,主要目的是完成对于 html 标签的匹配。 ¶元字符,metacharacter 正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。对于“元”这个概念,有必要引用一下不鳥萬如一在知乎上的一篇回答来帮助理解一下 錯譯的例子肯定是很多很多的,但我想單獨把 meta 拿出來講。這個概念本身因爲某種原因沒太能進入中文,或許和翻譯得不好有關,但也不一定。 Meta 這個前綴,通常只有在看學術類、專業書籍的時候纔會碰到,大陸通譯「元」。例如「元數據」(meta data)。我沒考據過當年是怎麼把 meta 翻譯成元的,但可以確定的是大部分人不懂元是什麼意思。 Meta 的意思其實一點也不玄,就是「關於什麼的什麼」。Meta data 就是「關於數據的數據」。例如一個 MP3 文件,它本身是音樂數據(data),但 MP3 文件裡顯示的歌手名字、歌曲名字、碼率等等,則是「關於這個 MP3 文件的數據」,所以叫 meta data。同樣,一張照片的 EXIF 信息也是這張照片的 meta data。 這個概念在英語世界的當代文化生活裡很常見,已經成爲了一種趣味。比如我可以說 Glenn Fleishman 主編的 The Magazine 是一本 meta-magazine,因爲它本身就是在探索雜誌這種形態的未來,是一本關於雜誌的雜誌。但在中文世界,不論是大陸的「元」還是臺灣的譯法「後設」都沒能普及。     阅读全文
藥師's avatar
藥師 10月 16, 2015

YAML 使用指南

因为最近做项目需要用到配置项,想了想之前接触过的XML和JSON都有点不方便,所以试试看YAML。本篇指南完全基于官方文档 YAML(尾音类似camel)是一个可读性高,用来表达数据序列化的语言。 在最初的时候YAML表示Yet Another Markup Language,但是现在YAML Ain’t Markup Language。 官方的定义是这样写的:YAML is a human friendly data serialization standard for all programming languages.     阅读全文
藥師's avatar
藥師 10月 15, 2015

你好!

¶博客搬家的背景 八月底从阿里离开之后,经过一顿面试,也收到了几个Offer,最后还是选择了华为,虽然华为在业界的口碑可能不是很好,但是今年给的待遇和机会都是值得一去的。 本来一直自己也有个博客,但是主要还是用来搭Shadowsocks用,关键每次刷完个题再去把东西搬过来,没什么意思,不如就在Github上面弄吧。     阅读全文
藥師's avatar
藥師 10月 09, 2015