Получение исходного кода HTML с использованием WebKit2
Я использую небольшую программу на Python3, которую я хотел бы переключить с Webkit на WebKit2. Короче говоря, я открываю веб-сайт в Gtk-окне и хотел бы сохранить HTML-код в переменной. Для WebKit это просто:
import sys
import gi
gi.require_version('WebKit', '3.0')
from gi.repository import WebKit
from gi.repository import Gtk, Gdk
starturl = 'https://www.google.de'
def printHTML(webview, frame):
html = frame.get_data_source().get_data().str
print(html)
webview = WebKit.WebView()
webview.open(starturl)
webview.connect("load-finished", printHTML)
win = Gtk.Window()
win.add(webview)
win.connect("delete-event", Gtk.main_quit)
win.set_default_size(800,600)
win.show_all()
Gtk.main()
С помощью WebKit2 все в порядке, за исключением: я не могу получить HTML-код...
import sys
import gi
gi.require_version('WebKit2', '4.0')
from gi.repository import WebKit2
from gi.repository import Gtk, Gdk
starturl = 'https://www.google.de'
def printHTML(webview, event):
html = ???
print(html)
webview = WebKit.WebView()
webview.load_uri(starturl)
webview.connect("load-changed", printHTML)
win = Gtk.Window()
win.add(webview)
win.connect("delete-event", Gtk.main_quit)
win.set_default_size(800,600)
win.show_all()
Gtk.main()
Есть ли эквивалент для 'frame' в WebKit2? Может быть, кто-то знает решение.
С уважением и спасибо. До
1 ответ
Вам нужно использовать WebView. Функция get_main_resource(), получает данные из этого ресурса и создает функцию обратного вызова для извлечения html-источника.
Этот пример кода был использован в классе:
def on_load_changed(self, webview, event):
if event == WebKit2.LoadEvent.FINISHED:
resource = webview.get_main_resource()
resource.get_data(None, self._get_response_data_finish, None)
def _get_response_data_finish(self, resource, result, user_data=None):
self.html_response = resource.get_data_finish(result)
print((self.html_response))