Войдите в Facebook, используя запросы Python

Я пытаюсь найти способ автоматического входа в Facebook без браузера, используя Python. Я экспериментировал с "запросами" lib. Пробовал несколько способов:

URL = 'http://m.facebook.com'
requests.get(URL, auth = ('email@domain.com', 'mypassword'))

...

form_data = {'email': 'email@domain.com',
             'pass' : 'mypassword'
            }
requests.post(URL, data = form_data)

...

requests.post(URL + '?email=email@domain.com&pass=mypassword')

Последний метод заполняет поле "email" на странице, но поле "pass" остается пустым...

Может ли кто-нибудь помочь мне с этим, пожалуйста? Можно ли эмулировать вход в FB с помощью запросов?

Спасибо!

9 ответов

Вам необходимо отправить полную форму. Самый простой способ узнать, чего ожидает Facebook, - это использовать что-то вроде инструментов разработчика Google Chrome для мониторинга ваших веб-запросов.

Чтобы упростить вашу жизнь, я проконтролировал свой собственный логин на Facebook и воспроизвел его ниже (очевидно, с удаленной личной информацией) с несущественной информацией:

Request URL:https://m.facebook.com/login.php?refsrc=https%3A%2F%2Fm.facebook.com%2F&refid=8
Request Method:POST

Form Data:
    lsd:AVqAE5Wf
    charset_test:€,´,€,´,水,Д,Є
    version:1
    ajax:0
    width:0
    pxr:0
    gps:0
    m_ts:1392974963
    li:cxwHUxatQiaLv1nZEYPp0aTB
    email:...
    pass:...
    login:Log In

Как видите, форма содержит много полей. Все это должно быть предоставлено, чтобы вы могли войти в систему. Электронная почта и пароль будут предоставлены вашим кодом. Остальные поля на самом деле имеют свои значения, установленные HTML-кодом, который обслуживает вас Facebook. Это означает, что для эмуляции входа в браузер необходимо выполнить следующие шаги:

  1. Сделать GET на страницу входа (https://m.facebook.com/)
  2. Используйте библиотеку разбора HTML (например, BeautifulSoup), чтобы проанализировать HTML и найти значения по умолчанию для полей формы.
    • Значения по умолчанию все в <input> HTML элементы ниже #login_form элемент. Вы хотите найти их по имени (например, charset_test) а потом вытащи их value приписывать.
    • Разработка того, как это сделать, выходит за рамки этого ответа, поэтому я не буду вдаваться в подробности.
  3. Объедините значения по умолчанию для полей формы с вашим адресом электронной почты и паролем, например так:

    data = {
        'lsd': lsd,
        'charset_test': csettest, 
        'version': version,
        'ajax': ajax,
        'width': width,
        'pxr': pxr,
        'gps': gps,
        'm_ts': mts,
        'li': li,
    }
    data['email'] = email
    data['pass'] = pass
    data['login'] = 'Log In'
    
  4. Отправьте свой логин с помощью запроса Session:

    s = requests.Session()
    r = s.post(url, data=data)
    r.raise_for_status()
    
  5. Отправьте весь свой будущий HTTP-трафик через это Session,

Как видите, это нетривиальный способ ведения дел. Это потому, что не ожидается, что программы будут использовать веб-сайт для входа в систему: вместо этого вы должны будете использовать их SDK или их веб-API.

Я тоже искал ответ. Делать это с requests это боль. Итак, я использовал механизировать.

import mechanize
browser = mechanize.Browser()
browser.set_handle_robots(False)
cookies = mechanize.CookieJar()
browser.set_cookiejar(cookies)
browser.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.41 Safari/534.7')]
browser.set_handle_refresh(False)

url = 'http://www.facebook.com/login.php'
self.browser.open(url)
self.browser.select_form(nr = 0)       #This is login-password form -> nr = number = 0
self.browser.form['email'] = YourLogin
self.browser.form['pass'] = YourPassw
response = self.browser.submit()
print response.read()

Оно работает. mechanize.browser является эмулированным браузером, поэтому вам не нужно отправлять все значения формы. Он отправит их как обычный браузер, вы должны предоставить только логин и пароль.

Удачи!

Библиотека вроде RoboBrowser делает такие вещи, как вход в Facebook очень простым:

import robobrowser

class Facebook(robobrowser.RoboBrowser):

    url = 'https://facebook.com'

    def __init__(self, email, password):
        self.email = email
        self.password = password
        super().__init__()
        self.login()

    def login(self):
        self.open(self.url)    
        login_form = self.get_form(id='login_form')
        login_form['email'] = self.email
        login_form['pass'] = self.password
        self.submit_form(login_form)

Вот мой рабочий код (май 2017 Python 3.6). Чтобы это работало для вас, просто напишите свое собственное имя пользователя, пароль и PROTECTED_URL

# https://gist.github.com/UndergroundLabs/fad38205068ffb904685
# this github example said tokens are also necessary, but I found 
# they were not needed
import requests

USERNAME = '-----@yahoo.com'
PASSWORD = '----password'
PROTECTED_URL = 'https://m.facebook.com/groups/318395378171876?view=members'
# my original intentions were to scrape data from the group page
# PROTECTED_URL = 'https://www.facebook.com/groups/318395378171876/members/'
# but the only working login code I found needs to use m.facebook URLs
# which can be found by logging into https://m.facebook.com/login/ and 
# going to the the protected page the same way you would on a desktop

def login(session, email, password):
    '''
    Attempt to login to Facebook. Returns cookies given to a user
    after they successfully log in.
    '''

    # Attempt to login to Facebook
    response = session.post('https://m.facebook.com/login.php', data={
        'email': email,
        'pass': password
    }, allow_redirects=False)

    assert response.status_code == 302
    assert 'c_user' in response.cookies
    return response.cookies

if __name__ == "__main__":

    session = requests.session()
    cookies = login(session, USERNAME, PASSWORD)
    response = session.get(PROTECTED_URL, cookies=cookies, 
allow_redirects=False)
    assert response.text.find('Home') != -1

    # to visually see if you got into the protected page, I recomend copying
    # the value of response.text, pasting it in the HTML input field of
    # http://codebeautify.org/htmlviewer/ and hitting the run button

Как говорят другие, использование запросов - это боль. Вы можете сделать это с помощью селена. Установите селен, зайдя на их сайт или просто используя pip.

pip install -U selenium

Я написал код ниже. Я попробовал это сам, и это работает.

from selenium.webdriver.firefox.firefox_binary import FirefoxBinary

binary = FirefoxBinary(r'C:\Program Files (x86)\Mozilla Firefox\firefox.exe')
driver = webdriver.Firefox(firefox_binary=binary)
driver.get('https://www.facebook.com/')


username= "your_username"
password = "your_password"

UN = driver.find_element_by_id('email')

UN.send_keys(username)

PS = driver.find_element_by_id('pass')

PS.send_keys(password)

LI = driver.find_element_by_id('loginbutton')

LI.click()

Прежде всего, вам нужны ВСЕ данные формы. Вы не можете просто отправить user+pass, сервер не допустит этого.
Во-вторых, вам нужно будет позаботиться и использовать файлы cookie, полученные от Facebook, чтобы это работало.

Но в целом, да, вы можете использовать request или любая другая библиотека.
Но я бы рекомендовал вместо этого использовать их API.

Сначала вы должны знать данные для публикации. Перейдите по этой ссылке.

После того, как вы получите все необходимые данные, код выглядит следующим образом:

import requests, bs4`    
s = requests.Session()
url = 'https://www.facebook.com/login'

res = s.get(url)
form_data = {
        # Copy paste the form data here as a valid python dict
}
s.post(url, data=form_data)

# Now try accessing your profile from sessions object

Это сработало для меня.

Я могу сказать, что довольно неприятно входить в Facebook без использования их API. Им также нравится все менять так часто, что работа над кодом - это просто работа.

Я сделал это некоторое время назад, но я не думаю, что мой код работает с текущей версией Facebook. Однако это должно быть полезной отправной точкой:

https://gitorious.org/blogsmashonfb/blogsmashonfb/source/4f7ee94a56fdffe9392485df8999e340f97f4bbe:

Он состоит из двух частей: веб-сканера и обработчика Facebook (последняя - то, что вас интересует).

Одна из основных проблем в вашем коде заключается в том, что вы должны сначала посетить Facebook, потому что они отправляют вам форму входа со скрытыми элементами, которые вам необходимо отправить обратно.

Это работает (апрель 2017)

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import argparse
import datetime
import json
import logging
import re
import random
import requests
import shutil
from pyquery import PyQuery as pq


def main(username, password):

    logging.basicConfig(filename='imgur2fb.log', level=logging.DEBUG)

    session = requests.session()

    uid, dtsg = login(session, username, password)


def login(session, username, password):

    '''
    Login to Facebook
    '''

    # Navigate to the Facebook homepage
    response = session.get('https://facebook.com')

    # Construct the DOM
    dom = pq(response.text)

    # Get the lsd value from the HTML. This is required to make the login request
    lsd = dom('[name="lsd"]').val()

    # Perform the login request
    response = session.post('https://www.facebook.com/login.php?login_attempt=1', data={
        'lsd': lsd,
        'email': username,
        'pass': password,
        'default_persistent': '0',
        'timezone': '-60',
        'lgndim': '',
        'lgnrnd': '',
        'lgnjs': '',
        'locale':'en_GB',
        'qsstamp': ''
    })

    '''
    Get the users ID and fb_dtsg token. The fb_dtsg token is required when making requests as a logged in user. It
    never changes, so we only need to grab this token once.

    If the login was successful a cookie 'c_user' is set by Facebook. If the login failed, the 'c_user' cookie
    will not be present. This will raise an exception.
    '''
    try:
        uid = session.cookies['c_user']
        dtsg = re.search(r'(type="hidden" name="fb_dtsg" value="([0-9a-zA-Z-_:]+)")', response.text).group(1)

        dtsg = dtsg[dtsg.find("value")+6:]
        dtsg = dtsg[1:-1]

    except KeyError:
        raise Exception('Login Failed!')

    return uid, dtsg



try:
    main(username='*****', password='*****')
except Exception, e:
    logging.exception(e)
    print e
Другие вопросы по тегам