lxml.etree.XMLSyntaxError: PCDATA invalid Char value 19, line 3642, column 70
Provocado por un carácter extraño que se ha colado en los datos, representado por ^S
<Row> <idconcepto>3501</idconcepto> <ididioma>ITA</ididioma> <texto>Gestione ^S Amministrazione</texto> <patron>Gestione ^S Amministrazione</patron> </Row>
Para evitar que salte este error, establecemos el parámetro recover del parser lxml a True.
dom = etree.parse(file_xml, \ etree.XMLParser(ns_clean=True, recover=True))
Referencias:
http://codespeak.net/lxml/parsing.html
No hay comentarios:
Publicar un comentario