Elimdeki bir dataset ile Text Mining yapmak niyetindeyim fakat daha ilk satirdan muhtemelen rtf'den kaynaklanan bir hata aliyorum.
Aciklarken adim adim gideyim, oncelikle;
Normal bir sekilde dataseti goruntulemeye calisirsam asagidaki hatayi aliyorum.
"UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 50: invalid start byte"
Eger read_csv satirina engine='python' veya encoding = 'iso-8859-1' veya 'latin1' veya 'cp1252' eklersem kismen hatayi gidermis olup dataseti goruntuleyebiliyorum.
Fakat DATA sutununda bu muhtemel rtf kaliyor ve bir turlu bundan kurtulamiyorum.
-Google'da cikan bircok cozum onerisini denedim fakat ise yaramadi. -En basta Excel'den temizlemek istedim fakat bunlari rtf olarak gormediginden temizlemedi. -Isletim sistemim win7 pro ve anaconda python3 kullaniyorum.
Eger sorunu biliyorsaniz veya bir fikriniz/oneriniz varsa cok makbule gececek, simdiden tesekkur ederim.
< Bu mesaj bu kişi tarafından değiştirildi guarin -- 4 Mayıs 2020; 17:30:48 >
1. sayfa
Hizmet kalitesi için çerezleri kullanabiliriz, DH'yi kullanırken depoladığımız çerezlerle ilgili veri politikamıza gözatın.
Elimdeki bir dataset ile Text Mining yapmak niyetindeyim fakat daha ilk satirdan muhtemelen rtf'den kaynaklanan bir hata aliyorum.
Aciklarken adim adim gideyim, oncelikle;
Normal bir sekilde dataseti goruntulemeye calisirsam asagidaki hatayi aliyorum.
"UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 50: invalid start byte"
Eger read_csv satirina engine='python' veya encoding = 'iso-8859-1' veya 'latin1' veya 'cp1252' eklersem kismen hatayi gidermis olup dataseti goruntuleyebiliyorum.
Fakat DATA sutununda bu muhtemel rtf kaliyor ve bir turlu bundan kurtulamiyorum.
< Resime gitmek için tıklayın >
-Google'da cikan bircok cozum onerisini denedim fakat ise yaramadi.
-En basta Excel'den temizlemek istedim fakat bunlari rtf olarak gormediginden temizlemedi.
-Isletim sistemim win7 pro ve anaconda python3 kullaniyorum.
Eger sorunu biliyorsaniz veya bir fikriniz/oneriniz varsa cok makbule gececek, simdiden tesekkur ederim.
< Bu mesaj bu kişi tarafından değiştirildi guarin -- 4 Mayıs 2020; 17:30:48 >