Я не могу читать персидский символ в R

Я предоставляю некоторые атрибуты столбцов и их значения на персидском языке в формате CSV и др. Txt Unicode. но когда я читаю его в R, все персидские значения будут бессмысленными. После запуска кода я вижу ниже:
в консоли:

data=read.csv("E:/ais/salar (2).csv",header = T, encoding="UTF-8")



      ï..Ù.Ø.Ù. Ù.Ø.Ù..Ø.Ø.Ù.Ù.Ø.Ø.Ú.ÛŒ تÙ.Ù.Ù..Ø.Ø.Ø.ت
1  دکتر غلامرضا      قاسمی ثانی   +9821 6616 6626
2  دکتر غلامرضا      قاسمی ثانی   +9821 6616 6626
3  دکتر غلامرضا      قاسمی ثانی   +9821 6616 6626
4  دکتر غلامرضا      قاسمی ثانی   +9821 6616 6626
5  دکتر غلامرضا      قاسمی ثانی   +9821 6616 6626

2 ответа

Попробуйте использовать encoding="UTF-8" во время чтения вашего файла

У меня тоже есть эта проблема... без учета кодировки, я даю что-то вроде этого:

    a <- read.csv("./data500000-960331.csv", header = TRUE, sep = ";")

    [1] Þã                 ÓíÓÊÇä æÈáæÓÊÇä   åãÏÇä              Þã                
   [5] ÝÇÑÓ               ÎÑÇÓÇä ÑÖæÆ        ÇÕÝåÇä             áÓÊÇä            
   [9] ÝÇÑÓ               áÓÊÇä             åÑãÒÇä            ÂÐÑÈÇíÌÇä ÔÑÞí    
  [13] ÂÐÑÈÇíÌÇä ÛÑÈí     ßÑãÇäÔÇå

и включив кодировку:

    a <- read.csv("./data500000-960331.csv", header = TRUE, sep = ";", encoding = "UTF-8")
    enter code here
    [3] \xe5\xe3\xcf\xc7\xe4                                                   
   [4] \xde\xe3                                                               
   [5] \xdd\xc7\xd1\xd3                                                       
   [6] \xce\xd1\xc7\xd3\xc7\xe4 \xd1\xd6\xe6\xc6                              
   [7] \xc7\xd5\xdd\xe5\xc7\xe4                                               
   [8] \u0090\xe1\xd3\xca\xc7\xe4                                             
   [9] \xdd\xc7\xd1\xd3                                                       
  [10] \u0090\xe1\xd3\xca\xc7\xe4                                             
  [11] \xe5\xd1\xe3Ґ\xc7\xe4                                                  
  [12] \xc2\xd0\xd1\xc8\xc7\xed\xcc\xc7\xe4 \xd4\xd1\xde\xed                  
  [13] \xc2\xd0\xd1\xc8\xc7\xed\xcc\xc7\xe4 \xdb\xd1\xc8\xed   
Другие вопросы по тегам