Arama butonu
Bu konudaki kullanıcılar: 1 misafir
0
Cevap
232
Tıklama
0
Öne Çıkarma
Unicode Decode Error
G
5 yıl
Er
Konu Sahibi

Merhabalar,

Elimdeki bir dataset ile Text Mining yapmak niyetindeyim fakat daha ilk satirdan muhtemelen rtf'den kaynaklanan bir hata aliyorum.

Aciklarken adim adim gideyim, oncelikle;

Normal bir sekilde dataseti goruntulemeye calisirsam asagidaki hatayi aliyorum.

"UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 50: invalid start byte"

Eger read_csv satirina engine='python' veya encoding = 'iso-8859-1' veya 'latin1' veya 'cp1252' eklersem kismen hatayi gidermis olup dataseti goruntuleyebiliyorum.

Fakat DATA sutununda bu muhtemel rtf kaliyor ve bir turlu bundan kurtulamiyorum.

< Resime gitmek için tıklayın >

-Google'da cikan bircok cozum onerisini denedim fakat ise yaramadi.
-En basta Excel'den temizlemek istedim fakat bunlari rtf olarak gormediginden temizlemedi.
-Isletim sistemim win7 pro ve anaconda python3 kullaniyorum.

Eger sorunu biliyorsaniz veya bir fikriniz/oneriniz varsa cok makbule gececek, simdiden tesekkur ederim.





< Bu mesaj bu kişi tarafından değiştirildi guarin -- 4 Mayıs 2020; 17:30:48 >

DH Mobil uygulaması ile devam edin. Mobil tarayıcınız ile mümkün olanların yanı sıra, birçok yeni ve faydalı özelliğe erişin. Gizle ve güncelleme çıkana kadar tekrar gösterme.