Диакритические символы в CSV, но в мастере импорта SQL Server они превратились в странные символы

У меня есть файл CSV, закодированный как UTF-8, который я скачал с IMDb.com. Я хотел бы импортировать эти данные в SSMS 2016 (или 2014) с помощью мастера импорта. Вот пример того, как выглядит CSV (обратите внимание, что директором Dallas Buyers Club является Жан-Марк Валле):

"position","const","created","modified","description","Title","Title type","Directors","You rated","IMDb Rating","Runtime (mins)","Year","Genres","Num. Votes","Release Date (month/day/year)","URL"
"38","tt1636826","Tue Feb 16 00:00:00 2016","","","Project X","Feature Film","Nima Nourizadeh","6","6.7","88","2012","comedy, crime","155628","2012-03-01","http://www.imdb.com/title/tt1636826/"
"39","tt0119528","Tue Feb 16 00:00:00 2016","","","Liar Liar","Feature Film","Tom Shadyac","6","6.8","86","1997","comedy, fantasy, romance","217817","1997-03-18","http://www.imdb.com/title/tt0119528/"
"40","tt0790636","Tue Feb 16 00:00:00 2016","","","Dallas Buyers Club","Feature Film","Jean-Marc Vallée","7","8.0","117","2013","biography, drama","321602","2013-09-07","http://www.imdb.com/title/tt0790636/"

Я выбираю "Источник плоских файлов" в мастере импорта, выбираю свой файл и использую параметры по умолчанию (при добавлении "в качестве квалификатора текста"). Однако это пример того, что я вижу: http://imgur.com/a/i53hB

Диакритический знак é превращается в é. Я попытался выбрать Unicode рядом с "Locale" в мастере импорта, но он преобразовал все в китайские иероглифы и поместил все в одну ячейку.

Есть идеи, что здесь происходит?

1 ответ

Решение

Измените кодировку для соединения с плоским файлом на кодовую страницу 65001 (UTF-8) и убедитесь, что тип данных - строка Unicode DT_WTSR.

Эта ссылка имеет более пошаговые инструкции. https://www.mssqltips.com/sqlservertip/3119/import-utf8-unicode-special-characters-with-sql-server-integration-services/

Другие вопросы по тегам