Я не могу читать персидский символ в R
Я предоставляю некоторые атрибуты столбцов и их значения на персидском языке в формате CSV и др. Txt Unicode. но когда я читаю его в R, все персидские значения будут бессмысленными. После запуска кода я вижу ниже:
в консоли:
data=read.csv("E:/ais/salar (2).csv",header = T, encoding="UTF-8")
ï..Ù.Ø.Ù. Ù.Ø.Ù..Ø.Ø.Ù.Ù.Ø.Ø.Ú.ÛŒ تÙ.Ù.Ù..Ø.Ø.Ø.ت
1 دکتر غلامرضا قاسمی ثانی +9821 6616 6626
2 دکتر غلامرضا قاسمی ثانی +9821 6616 6626
3 دکتر غلامرضا قاسمی ثانی +9821 6616 6626
4 دکتر غلامرضا قاسمی ثانی +9821 6616 6626
5 دکتر غلامرضا قاسمی ثانی +9821 6616 6626
2 ответа
Попробуйте использовать encoding="UTF-8" во время чтения вашего файла
У меня тоже есть эта проблема... без учета кодировки, я даю что-то вроде этого:
a <- read.csv("./data500000-960331.csv", header = TRUE, sep = ";")
[1] Þã ÓíÓÊÇä æÈáæÓÊÇä åãÏÇä Þã
[5] ÝÇÑÓ ÎÑÇÓÇä ÑÖæÆ ÇÕÝåÇä áÓÊÇä
[9] ÝÇÑÓ áÓÊÇä åÑãÒÇä ÂÐÑÈÇíÌÇä ÔÑÞí
[13] ÂÐÑÈÇíÌÇä ÛÑÈí ßÑãÇäÔÇå
и включив кодировку:
a <- read.csv("./data500000-960331.csv", header = TRUE, sep = ";", encoding = "UTF-8")
enter code here
[3] \xe5\xe3\xcf\xc7\xe4
[4] \xde\xe3
[5] \xdd\xc7\xd1\xd3
[6] \xce\xd1\xc7\xd3\xc7\xe4 \xd1\xd6\xe6\xc6
[7] \xc7\xd5\xdd\xe5\xc7\xe4
[8] \u0090\xe1\xd3\xca\xc7\xe4
[9] \xdd\xc7\xd1\xd3
[10] \u0090\xe1\xd3\xca\xc7\xe4
[11] \xe5\xd1\xe3Ґ\xc7\xe4
[12] \xc2\xd0\xd1\xc8\xc7\xed\xcc\xc7\xe4 \xd4\xd1\xde\xed
[13] \xc2\xd0\xd1\xc8\xc7\xed\xcc\xc7\xe4 \xdb\xd1\xc8\xed