Elimdeki bir dataset ile Text Mining yapmak niyetindeyim fakat daha ilk satirdan muhtemelen rtf'den kaynaklanan bir hata aliyorum.
Aciklarken adim adim gideyim, oncelikle;
Normal bir sekilde dataseti goruntulemeye calisirsam asagidaki hatayi aliyorum.
"UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 50: invalid start byte"
Eger read_csv satirina engine='python' veya encoding = 'iso-8859-1' veya 'latin1' veya 'cp1252' eklersem kismen hatayi gidermis olup dataseti goruntuleyebiliyorum.
Fakat DATA sutununda bu muhtemel rtf kaliyor ve bir turlu bundan kurtulamiyorum.
-Google'da cikan bircok cozum onerisini denedim fakat ise yaramadi. -En basta Excel'den temizlemek istedim fakat bunlari rtf olarak gormediginden temizlemedi. -Isletim sistemim win7 pro ve anaconda python3 kullaniyorum.
Eger sorunu biliyorsaniz veya bir fikriniz/oneriniz varsa cok makbule gececek, simdiden tesekkur ederim.
< Bu mesaj bu kişi tarafından değiştirildi guarin -- 4 Mayıs 2020; 17:30:48 >
Elimdeki bir dataset ile Text Mining yapmak niyetindeyim fakat daha ilk satirdan muhtemelen rtf'den kaynaklanan bir hata aliyorum.
Aciklarken adim adim gideyim, oncelikle;
Normal bir sekilde dataseti goruntulemeye calisirsam asagidaki hatayi aliyorum.
"UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 50: invalid start byte"
Eger read_csv satirina engine='python' veya encoding = 'iso-8859-1' veya 'latin1' veya 'cp1252' eklersem kismen hatayi gidermis olup dataseti goruntuleyebiliyorum.
Fakat DATA sutununda bu muhtemel rtf kaliyor ve bir turlu bundan kurtulamiyorum.
< Resime gitmek için tıklayın >
-Google'da cikan bircok cozum onerisini denedim fakat ise yaramadi.
-En basta Excel'den temizlemek istedim fakat bunlari rtf olarak gormediginden temizlemedi.
-Isletim sistemim win7 pro ve anaconda python3 kullaniyorum.
Eger sorunu biliyorsaniz veya bir fikriniz/oneriniz varsa cok makbule gececek, simdiden tesekkur ederim.
< Bu mesaj bu kişi tarafından değiştirildi guarin -- 4 Mayıs 2020; 17:30:48 >