あるあるあるある

グーグル、また基盤技術の1つをオープンソース化

XMLは優れているが、グーグルで扱うデータ量はXMLにするには多すぎる。HTMLのような構造化されたテキストデータならXMLでも構わないが、シンプルなデータを扱うには、XMLはデコードやエンコード、ツリーのパースなどの処理が面倒だ。Protocol BuffersはIDLに似ていると思うかもしれないが、IDLは複雑すぎるという問題がある

全くおっしゃるとおりでございます。だって、SAXとか使わないで

reg = re.compile(r'<name>(?P<name>[^<]+)</name>')
m = reg.search(line)
if m:
    print m.group('name')

とかしちゃった方が速いんだもの。

グーグル、XMLに代わるデータ交換ツール「Protocol Buffers」をオープンソース化:ニュース – CNET Japan