Python: запросы не будут POST, если у меня есть пунктуация в моих данных
У меня есть small_file.txt
файл, который содержит:
1asdfaksdjfhlaksjdhflkjashdflkjhasldkjfhlaksdfhasdf:
2asdfaksdjfhlaksjdhflkjashdflkjhasldkjfhlaksdfhasdf:
3asdfaksdjfhlaksjdhflkjashdflkjhasldkjfhlaksdfhasdf
4asdfaksdjfhlaksjdhflkjashdflkjhasldkjfhlaksdfhasdf:
Обратите внимание на двоеточия в конце, они просто обычные строки.
Когда я пытаюсь отправить его с помощью python requests
это не работает По какой-то причине он ожидает первую строку с двоеточием, а затем отправляет все строки, начиная с этого. Так, например, в файле выше, он будет POST
только:
3asdfaksdjfhlaksjdhflkjashdflkjhasldkjfhlaksdfhasdf
4asdfaksdjfhlaksjdhflkjashdflkjhasldkjfhlaksdfhasdf:
Как я могу исправить эту проблему? Я не уверен, что происходит.
Вот простая версия моего кода:
import requests
import sys
import json
import os
token = 'nVQowAng0c'
url = "https://api.hipchat.com/v2/room/test_room/share/file"
headers = {'Content-type': 'multipart/related; boundary=boundary123456'}
headers['Authorization'] = "Bearer " + token
filepath = 'small_file.csv'
data = open(filepath, 'rb').read()
payload = """\
--boundary123456
Content-Type: application/json; charset=UTF-8
Content-Disposition: attachment; name="metadata"
--boundary123456
Content-Disposition: attachment; name="file"; filename="{0}"
{1}
--boundary123456--\
""".format(os.path.basename(filepath), data)
r = requests.post(url, headers=headers, data=payload)
r.raise_for_status()
Когда я пытаюсь отправить что-то вроде .csv
файл с отметкой времени в каждой строке, ничего не будет отправлено, потому что каждая строка имеет двоеточие.
2 ответа
Ваша немедленная ошибка в том, что вы неправильно кодировали составные элементы MIME. Каждая часть имеет два раздела, заголовки и содержимое, с двойным переводом строки. У вас отсутствует второй символ новой строки, добавьте его в:
payload = """\
--boundary123456
Content-Type: application/json; charset=UTF-8
Content-Disposition: attachment; name="metadata"
--boundary123456
Content-Disposition: attachment; name="file"; filename="{0}"
{1}
--boundary123456--\
""".format(os.path.basename(filepath), data)
Я бы не собирал содержимое вручную, а изменил бы назначение requests-toolbelt
проект, позволяющий загружать данные в потоковом режиме:
from requests_toolbelt import MultipartEncoder
class MultipartRelatedEncoder(MultipartEncoder):
"""A multipart/related encoder"""
@property
def content_type(self):
return str(
'multipart/related; boundary={0}'.format(self.boundary_value)
)
def _iter_fields(self):
# change content-disposition from form-data to attachment
for field in super(MultipartRelatedEncoder, self)._iter_fields():
content_type = field.headers['Content-Type']
field.make_multipart(
content_disposition='attachment',
content_type=content_type)
yield field
m = MultipartRelatedEncoder(
fields={
'metadata': (None, '', 'application/json; charset=UTF-8'),
'file': (os.path.basename(filepath), open(filepath, 'rb'), 'text/csv'),
}
)
headers['Content-type'] = m.content_type
r = requests.post(url, data=m, headers=headers)
Я адаптировал requests_toolbelt.MultipartEncoder
класс испускать multipart/related
поток данных, а не multipart/form-data
сообщение.
Обратите внимание, что я передаю объект открытого файла, а не сами данные файла; это потому что MultipartEncoder
позволяет передавать данные на удаленный сервер, файл не должен считываться в память за один раз.
Вы, вероятно, хотите передать фактические данные JSON в metadata
часть; заменить пустую строку в (None, '', 'application/json; charset=UTF-8'
кортеж с допустимым документом JSON.
Вот объединенный код от @Martijn Pieters:
# do this:
# pip install requests_toolbelt
from os import path
from sys import exit, stderr
from requests import post
from requests_toolbelt import MultipartEncoder
class MultipartRelatedEncoder(MultipartEncoder):
"""A multipart/related encoder"""
@property
def content_type(self):
return str('multipart/related; boundary={0}'.format(self.boundary_value))
def _iter_fields(self):
# change content-disposition from form-data to attachment
for field in super(MultipartRelatedEncoder, self)._iter_fields():
content_type = field.headers['Content-Type']
field.make_multipart(content_disposition = 'attachment',
content_type = content_type)
yield field
def hipchat_file(token, room, filepath, host='api.hipchat.com'):
if not path.isfile(filepath):
raise ValueError("File '{0}' does not exist".format(filepath))
url = "https://{0}/v2/room/{1}/share/file".format(host, room)
headers = {'Content-type': 'multipart/related; boundary=boundary123456'}
headers['Authorization'] = "Bearer " + token
m = MultipartRelatedEncoder(fields={'metadata' : (None, '', 'application/json; charset=UTF-8'),
'file' : (path.basename(filepath), open(filepath, 'rb'), 'text/csv')})
headers['Content-type'] = m.content_type
r = post(url, data=m, headers=headers)
if __name__ == '__main__:
my_token = <my token>
my_room = <room name>
my_file = <filepath>
try:
hipchat_file(my_token, my_room, my_file)
except Exception as e:
msg = "[ERROR] HipChat file failed: '{0}'".format(e)
print(msg, file=stderr)
exit(1)