[Fc_general] Parseo de CSV

Roberto Figueroa roberto.figueroa en gmail.com
Mie Jun 28 18:24:23 EDT 2017


Yo haría un REPLACE de "," por "-"

     cadena.replace('","','"-"')

De esa forma queda una cadena así:

"campo1"-"campo2"-"campo3"-"campo4_A=subA1,subA2,subA3\ncampo4_B=subB1,subB2"-"campo5"

La cuál ya se  puede separar mediante el guión:

     elems = cadena.split("-")

Después, para cada elemento revisar si contiene un "="

     for elem in elems:
         if elem.find("=") >= 0:
               # procesar el elemento para separarlo


Algo así.
Qué chido es Python


2017-06-28 16:57 GMT-05:00 Abraham Castillo <abraham.castillo en gmail.com>:

> sip, eso sí, el *=* va justo antes de listar los elementos y siempre
> terminan con *\n*
>
> A esos yo los estoy tratando de usar como separadores secundarios
>
> ya voy avanzado en python, pero es un bonito cochinero que con gusto (y
> pena) les comparto cuando "corra"
>
> Gracias y Saludos!
>
> On Wed, Jun 28, 2017 at 4:48 PM Roberto Figueroa <
> roberto.figueroa en gmail.com> wrote:
>
>> Pero siempre lleva "=" cuando siguen sub elementos?
>> Y siempre lleva "\" cuando se terminan esos sub elementos?
>>
>> 2017-06-28 15:50 GMT-05:00 Abraham Castillo <abraham.castillo en gmail.com>:
>>
>>> no, ay esta lo triste, tanto 4A y 4B pueden tener uno o mas elementos
>>>
>>> On Wed, Jun 28, 2017 at 3:24 PM Juan Manuel Gonzalez-Sicilia <
>>> jsicilia en gmail.com> wrote:
>>>
>>>> Es fijo el numero de subs del campo 4A y 4B? O variable
>>>>
>>>> On Jun 28, 2017 3:05 PM, "Abraham Castillo" <abraham.castillo en gmail.com>
>>>> wrote:
>>>>
>>>>> Hola,
>>>>>
>>>>> Ahora que sí que "solo por convivir", pregunto, de qué manera
>>>>> procesarían un archivo separado por comas en el cual uno de sus campos
>>>>> tiene además otros valores, tambien separados por comas?
>>>>>
>>>>> ejemplo:
>>>>>
>>>>> "campo1","campo2","campo3","campo4_A=subA1,subA2,subA3\
>>>>> ncampo4_B=subB1,subB2","campo5"
>>>>>
>>>>> que, por claridad desmenusaria asi:
>>>>>
>>>>> "campo1",
>>>>> "campo2",
>>>>> "campo3",
>>>>> "campo4_A=
>>>>>     subA1,
>>>>>     subA2,
>>>>>     subA3\n
>>>>>   campo4_B=
>>>>>     subB1,
>>>>>     subB2",
>>>>> "campo5"
>>>>>
>>>>>
>>>>> ¿Que herramienta se les antoja que pueda usarse para una solucion
>>>>> simple?
>>>>>
>>>>> con awk tengo el inconveniente de que usa la coma a lo largo de toodo
>>>>> el renglon, con python a penas estoy intentando pero como estoy muy oxidado
>>>>> en estos dos (en todos?) pues quise pedir la opinion del bonito publico
>>>>> conocedor de esta HHH lista.
>>>>>
>>>>> Saludos desde la lluviosa GDL,
>>>>>
>>>>> Abraham
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> Fc_general mailing list
>>>>> Fc_general en forocomputacion.net
>>>>> http://forocomputacion.net/mailman/listinfo/fc_general_
>>>>> forocomputacion.net
>>>>>
>>>>> _______________________________________________
>>>> Fc_general mailing list
>>>> Fc_general en forocomputacion.net
>>>> http://forocomputacion.net/mailman/listinfo/fc_general_
>>>> forocomputacion.net
>>>>
>>>
>>> _______________________________________________
>>> Fc_general mailing list
>>> Fc_general en forocomputacion.net
>>> http://forocomputacion.net/mailman/listinfo/fc_general_
>>> forocomputacion.net
>>>
>>>
>>
>>
>> --
>> Saludos!
>> Robert
>> _______________________________________________
>> Fc_general mailing list
>> Fc_general en forocomputacion.net
>> http://forocomputacion.net/mailman/listinfo/fc_general_
>> forocomputacion.net
>>
>
> _______________________________________________
> Fc_general mailing list
> Fc_general en forocomputacion.net
> http://forocomputacion.net/mailman/listinfo/fc_general_forocomputacion.net
>
>


-- 
Saludos!
Robert
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://forocomputacion.net/pipermail/fc_general_forocomputacion.net/attachments/20170628/15ab3911/attachment.html>


Más información sobre la lista de distribución Fc_general