python 解析excel2003/2007

对于一些老的excel文件,通过xlrd不能处理。
而百度的结果是利用openpyxl来解析。不过我在使用的过程中还是碰到一些问题。

后来直接看了下这些excel的内容。发现这些excel的内容基本上就是一个html表格,因此直接用BeautifulSoup解析就可以了。

开始的时候,BeautifulSoup解析也碰到一些问题,经过不断试错,发现原因在于这个文件最头上的meta 数据,把头上的这一行数据删除,BeautifulSoup就可以正确解析了。


import urllib2

content = urllib2.urlopen(url).read()

start_point=content.index(“

原excel的第一行内容为:


<meta http-equiv="Content-Type" content="text/html; charset=GBK">        

<table ...       


本文地址: http://www.bagualu.net/wordpress/archives/4391 转载请注明




发表评论

电子邮件地址不会被公开。 必填项已用*标注