Войдите в Facebook, используя запросы Python
Я пытаюсь найти способ автоматического входа в Facebook без браузера, используя Python. Я экспериментировал с "запросами" lib. Пробовал несколько способов:
URL = 'http://m.facebook.com'
requests.get(URL, auth = ('email@domain.com', 'mypassword'))
...
form_data = {'email': 'email@domain.com',
'pass' : 'mypassword'
}
requests.post(URL, data = form_data)
...
requests.post(URL + '?email=email@domain.com&pass=mypassword')
Последний метод заполняет поле "email" на странице, но поле "pass" остается пустым...
Может ли кто-нибудь помочь мне с этим, пожалуйста? Можно ли эмулировать вход в FB с помощью запросов?
Спасибо!
9 ответов
Вам необходимо отправить полную форму. Самый простой способ узнать, чего ожидает Facebook, - это использовать что-то вроде инструментов разработчика Google Chrome для мониторинга ваших веб-запросов.
Чтобы упростить вашу жизнь, я проконтролировал свой собственный логин на Facebook и воспроизвел его ниже (очевидно, с удаленной личной информацией) с несущественной информацией:
Request URL:https://m.facebook.com/login.php?refsrc=https%3A%2F%2Fm.facebook.com%2F&refid=8
Request Method:POST
Form Data:
lsd:AVqAE5Wf
charset_test:€,´,€,´,水,Д,Є
version:1
ajax:0
width:0
pxr:0
gps:0
m_ts:1392974963
li:cxwHUxatQiaLv1nZEYPp0aTB
email:...
pass:...
login:Log In
Как видите, форма содержит много полей. Все это должно быть предоставлено, чтобы вы могли войти в систему. Электронная почта и пароль будут предоставлены вашим кодом. Остальные поля на самом деле имеют свои значения, установленные HTML-кодом, который обслуживает вас Facebook. Это означает, что для эмуляции входа в браузер необходимо выполнить следующие шаги:
- Сделать GET на страницу входа (
https://m.facebook.com/
) - Используйте библиотеку разбора HTML (например, BeautifulSoup), чтобы проанализировать HTML и найти значения по умолчанию для полей формы.
- Значения по умолчанию все в
<input>
HTML элементы ниже#login_form
элемент. Вы хотите найти их по имени (например,charset_test
) а потом вытащи ихvalue
приписывать. - Разработка того, как это сделать, выходит за рамки этого ответа, поэтому я не буду вдаваться в подробности.
- Значения по умолчанию все в
Объедините значения по умолчанию для полей формы с вашим адресом электронной почты и паролем, например так:
data = { 'lsd': lsd, 'charset_test': csettest, 'version': version, 'ajax': ajax, 'width': width, 'pxr': pxr, 'gps': gps, 'm_ts': mts, 'li': li, } data['email'] = email data['pass'] = pass data['login'] = 'Log In'
Отправьте свой логин с помощью запроса
Session
:s = requests.Session() r = s.post(url, data=data) r.raise_for_status()
Отправьте весь свой будущий HTTP-трафик через это
Session
,
Как видите, это нетривиальный способ ведения дел. Это потому, что не ожидается, что программы будут использовать веб-сайт для входа в систему: вместо этого вы должны будете использовать их SDK или их веб-API.
Я тоже искал ответ. Делать это с requests
это боль. Итак, я использовал механизировать.
import mechanize
browser = mechanize.Browser()
browser.set_handle_robots(False)
cookies = mechanize.CookieJar()
browser.set_cookiejar(cookies)
browser.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.41 Safari/534.7')]
browser.set_handle_refresh(False)
url = 'http://www.facebook.com/login.php'
self.browser.open(url)
self.browser.select_form(nr = 0) #This is login-password form -> nr = number = 0
self.browser.form['email'] = YourLogin
self.browser.form['pass'] = YourPassw
response = self.browser.submit()
print response.read()
Оно работает. mechanize.browser
является эмулированным браузером, поэтому вам не нужно отправлять все значения формы. Он отправит их как обычный браузер, вы должны предоставить только логин и пароль.
Удачи!
Библиотека вроде RoboBrowser делает такие вещи, как вход в Facebook очень простым:
import robobrowser
class Facebook(robobrowser.RoboBrowser):
url = 'https://facebook.com'
def __init__(self, email, password):
self.email = email
self.password = password
super().__init__()
self.login()
def login(self):
self.open(self.url)
login_form = self.get_form(id='login_form')
login_form['email'] = self.email
login_form['pass'] = self.password
self.submit_form(login_form)
Вот мой рабочий код (май 2017 Python 3.6). Чтобы это работало для вас, просто напишите свое собственное имя пользователя, пароль и PROTECTED_URL
# https://gist.github.com/UndergroundLabs/fad38205068ffb904685
# this github example said tokens are also necessary, but I found
# they were not needed
import requests
USERNAME = '-----@yahoo.com'
PASSWORD = '----password'
PROTECTED_URL = 'https://m.facebook.com/groups/318395378171876?view=members'
# my original intentions were to scrape data from the group page
# PROTECTED_URL = 'https://www.facebook.com/groups/318395378171876/members/'
# but the only working login code I found needs to use m.facebook URLs
# which can be found by logging into https://m.facebook.com/login/ and
# going to the the protected page the same way you would on a desktop
def login(session, email, password):
'''
Attempt to login to Facebook. Returns cookies given to a user
after they successfully log in.
'''
# Attempt to login to Facebook
response = session.post('https://m.facebook.com/login.php', data={
'email': email,
'pass': password
}, allow_redirects=False)
assert response.status_code == 302
assert 'c_user' in response.cookies
return response.cookies
if __name__ == "__main__":
session = requests.session()
cookies = login(session, USERNAME, PASSWORD)
response = session.get(PROTECTED_URL, cookies=cookies,
allow_redirects=False)
assert response.text.find('Home') != -1
# to visually see if you got into the protected page, I recomend copying
# the value of response.text, pasting it in the HTML input field of
# http://codebeautify.org/htmlviewer/ and hitting the run button
Как говорят другие, использование запросов - это боль. Вы можете сделать это с помощью селена. Установите селен, зайдя на их сайт или просто используя pip.
pip install -U selenium
Я написал код ниже. Я попробовал это сам, и это работает.
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
binary = FirefoxBinary(r'C:\Program Files (x86)\Mozilla Firefox\firefox.exe')
driver = webdriver.Firefox(firefox_binary=binary)
driver.get('https://www.facebook.com/')
username= "your_username"
password = "your_password"
UN = driver.find_element_by_id('email')
UN.send_keys(username)
PS = driver.find_element_by_id('pass')
PS.send_keys(password)
LI = driver.find_element_by_id('loginbutton')
LI.click()
Прежде всего, вам нужны ВСЕ данные формы. Вы не можете просто отправить user+pass, сервер не допустит этого.
Во-вторых, вам нужно будет позаботиться и использовать файлы cookie, полученные от Facebook, чтобы это работало.
Но в целом, да, вы можете использовать request
или любая другая библиотека.
Но я бы рекомендовал вместо этого использовать их API.
Сначала вы должны знать данные для публикации. Перейдите по этой ссылке.
После того, как вы получите все необходимые данные, код выглядит следующим образом:
import requests, bs4`
s = requests.Session()
url = 'https://www.facebook.com/login'
res = s.get(url)
form_data = {
# Copy paste the form data here as a valid python dict
}
s.post(url, data=form_data)
# Now try accessing your profile from sessions object
Это сработало для меня.
Я могу сказать, что довольно неприятно входить в Facebook без использования их API. Им также нравится все менять так часто, что работа над кодом - это просто работа.
Я сделал это некоторое время назад, но я не думаю, что мой код работает с текущей версией Facebook. Однако это должно быть полезной отправной точкой:
https://gitorious.org/blogsmashonfb/blogsmashonfb/source/4f7ee94a56fdffe9392485df8999e340f97f4bbe:
Он состоит из двух частей: веб-сканера и обработчика Facebook (последняя - то, что вас интересует).
Одна из основных проблем в вашем коде заключается в том, что вы должны сначала посетить Facebook, потому что они отправляют вам форму входа со скрытыми элементами, которые вам необходимо отправить обратно.
Это работает (апрель 2017)
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import argparse
import datetime
import json
import logging
import re
import random
import requests
import shutil
from pyquery import PyQuery as pq
def main(username, password):
logging.basicConfig(filename='imgur2fb.log', level=logging.DEBUG)
session = requests.session()
uid, dtsg = login(session, username, password)
def login(session, username, password):
'''
Login to Facebook
'''
# Navigate to the Facebook homepage
response = session.get('https://facebook.com')
# Construct the DOM
dom = pq(response.text)
# Get the lsd value from the HTML. This is required to make the login request
lsd = dom('[name="lsd"]').val()
# Perform the login request
response = session.post('https://www.facebook.com/login.php?login_attempt=1', data={
'lsd': lsd,
'email': username,
'pass': password,
'default_persistent': '0',
'timezone': '-60',
'lgndim': '',
'lgnrnd': '',
'lgnjs': '',
'locale':'en_GB',
'qsstamp': ''
})
'''
Get the users ID and fb_dtsg token. The fb_dtsg token is required when making requests as a logged in user. It
never changes, so we only need to grab this token once.
If the login was successful a cookie 'c_user' is set by Facebook. If the login failed, the 'c_user' cookie
will not be present. This will raise an exception.
'''
try:
uid = session.cookies['c_user']
dtsg = re.search(r'(type="hidden" name="fb_dtsg" value="([0-9a-zA-Z-_:]+)")', response.text).group(1)
dtsg = dtsg[dtsg.find("value")+6:]
dtsg = dtsg[1:-1]
except KeyError:
raise Exception('Login Failed!')
return uid, dtsg
try:
main(username='*****', password='*****')
except Exception, e:
logging.exception(e)
print e