XMLは優れているが、グーグルで扱うデータ量はXMLにするには多すぎる。HTMLのような構造化されたテキストデータならXMLでも構わないが、シンプルなデータを扱うには、XMLはデコードやエンコード、ツリーのパースなどの処理が面倒だ。Protocol BuffersはIDLに似ていると思うかもしれないが、IDLは複雑すぎるという問題がある
全くおっしゃるとおりでございます。だって、SAXとか使わないで
reg = re.compile(r'<name>(?P<name>[^<]+)</name>')
m = reg.search(line)
if m:
print m.group('name')
とかしちゃった方が速いんだもの。
グーグル、XMLに代わるデータ交換ツール「Protocol Buffers」をオープンソース化:ニュース – CNET Japan