Docker + Python3 UTF8 argv проблемы

Рассмотрим следующую программу на Python, которая выводит понимание того, какие аргументы командной строки она получила:

#!/usr/bin/env python3
print(repr(__import__("sys").argv))

Вот что происходит, когда я запускаю его с китайским символом в качестве аргумента:

$ /tmp/mytest 我                          
['/tmp/mytest', '我']

Теперь рассмотрим следующий Dockerfile, который помещает его в / tmp / mytest:

FROM ubuntu:18.04
RUN apt-get update && apt-get install -y python3
RUN echo '#!/usr/bin/env python3' >> /tmp/mytest
RUN echo 'print(repr(__import__("sys").argv))' >> /tmp/mytest
RUN chmod +x /tmp/mytest

Когда я пытаюсь запустить его, вывод отличается:

$ sudo docker build -t mytest .                
Sending build context to Docker daemon  20.48kB
Step 1/5 : FROM ubuntu:18.04
 ---> 02f9d6707661
Step 2/5 : RUN apt-get update && apt-get install -y python3
 ---> Using cache
 ---> 5c9a6768a337
Step 3/5 : RUN echo '#!/usr/bin/env python3' >> /tmp/mytest
 ---> Using cache
 ---> e0410fc9684e
Step 4/5 : RUN echo 'print(repr(__import__("sys").argv))' >> /tmp/mytest
 ---> Using cache
 ---> d123c9645c5c
Step 5/5 : RUN chmod +x /tmp/mytest
 ---> Using cache
 ---> 9b2ac9b174e0
Successfully built 9b2ac9b174e0
Successfully tagged mytest:latest
$ sudo docker run -ti mytest /tmp/mytest 我
['/tmp/mytest', '\udce6\udc88\udc91']

Это почему? Виноват ли Докер или Питон? Как заставить скрипт работать одинаково в обоих случаях?

1 ответ

Очевидно, что проблема исчезнет, ​​если вы создадите и экспортируете локаль UTF8, как в следующем Dockerfile:

FROM ubuntu:18.04
RUN apt-get update && apt-get install -y python3 locales
RUN echo '#!/usr/bin/env python3' >> /tmp/mytest
RUN echo 'print(repr(__import__("sys").argv))' >> /tmp/mytest
RUN locale-gen en_US.UTF-8
ENV LC_ALL=en_US.UTF-8
RUN chmod +x /tmp/mytest
Другие вопросы по тегам