WebKit2 и DomDocument/JavaScriptCore (Python3)

Я конвертирую приложение Python3 для использования WebKit2 вместо WebKit (который больше не доступен в Debian Buster).

В приложении пользователь может (де) установить флажки, которые я прочитал из приложения Python3. В исходном коде я мог просто получить DomDocument WebView и перебрать дочерние объекты, чтобы вернуть значение объекта с заданным именем (пример кода ниже).

В WebKit2 функция get_dom_document больше не доступна, и в документации по WebKit2 не ясно, как действовать дальше.

Кто-нибудь знает, как получить DomDocument из WebKit2 Webview или другой способ перебрать все объекты по имени и получить их значение?

Пример кода DomDocument из WebKit Webview:

def get_element_values(self, element_name):
    values = []
    doc = self.get_dom_document()
    elements = doc.get_elements_by_name(element_name)
    for i in range(elements.get_length()):
        child = elements.item(i)
        value = child.get_value().strip()
        if not child.get_checked():
            value = ''
        if value:
            values.append(value)
    return values

Примечание: "self" - это WebKit.Webview.

[РЕДАКТИРОВАТЬ]

Я экспериментировал с этим. Сначала я попытался получить DomDocument, сначала получив объект WebPage. Я обнаружил WebView.get_page_id() и WebKit2WebExtension.get_page(page_id), но, к сожалению, это дало мне эту ошибку: AttributeError: "gi.repository.WebKit2WebExtension" объект не имеет атрибута "get_page".

После этого я попробовал JavaScriptCore и вставил JavaScript с помощью WebView.run_javascript() и WebView.run_javascript_finish(). Я получаю объект JavaScriptResult обратно, но когда я пытаюсь получить значение с помощью.get_value(), я получаю эту ошибку: TypeError: Не удалось найти сторонний преобразователь структуры для 'JavaScriptCore.Value'.

Здесь был пользователь с такой же проблемой, но предложенное решение было слишком сложным и для меня.

Вот код, который я использовал для тестирования (проверьте функции get_element_values ​​() и javascript_finished()):

#! /usr/bin/env python3

# WebKit2 reference: https://webkitgtk.org/reference/webkit2gtk/stable
# Code examples: https://github.com/sidus-dev/poseidon/blob/master/poseidon.py

import gi
gi.require_version('WebKit2', '4.0')
gi.require_version('WebKit2WebExtension', '4.0')
from gi.repository import WebKit2, WebKit2WebExtension, Gtk
from os.path import exists
import webbrowser
import re


class SimpleBrowser(WebKit2.WebView):
    def __init__(self):
        WebKit2.WebView.__init__(self)

        # Get version
        self.webkit_ver = WebKit2.get_major_version(), WebKit2.get_minor_version(), WebKit2.get_micro_version()
        print(("WebKit2 Version: {0}".format('.'.join(map(str, self.webkit_ver)))))

        # Signals
        self.connect('decide-policy', self.on_decide_policy)
        #self.connect("load_changed", self.on_load_changed)
        self.connect("load-failed", self.on_load_failed)
        self.connect('button-press-event', lambda w, e: e.button == 3)

        # Settings
        s = self.get_settings()
        s.set_property('allow_file_access_from_file_urls', True)
        s.set_property('enable-spatial-navigation', False)
        s.set_property('enable_javascript', True)


    def show_html(self, html_or_url):
        if exists(html_or_url):
            matchObj = re.search('^file:\/\/', html_or_url)
            if not matchObj:
                html_or_url = "file://{0}".format(html_or_url)
        matchObj = re.search('^[a-z]+:\/\/', html_or_url)
        if matchObj:
            self.load_uri(html_or_url)
        else:
            self.load_html(html_or_url)
        self.show()

    def get_element_values(self, object, element_name):
        # JavaScript > dead end :(
        # https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebView.html#webkit-web-view-run-javascript
        js = 'var e = document.getElementsByName("' + element_name + '"); var r = []; var c = 0; ' \
             'for (var i = 0; i < e.length; i++) { if (e[i].checked) { r[c] = e[i].value; c++;} }'
        self.run_javascript(js, None, self.javascript_finished, None);
        return

        # DOM > dead end :(
        # https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebPage.html
        # https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebView.html#webkit-web-view-get-page-id
        page_id = self.get_page_id()
        print((page_id))
        # https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebExtension.html#webkit-web-extension-get-page
        # AttributeError: 'gi.repository.WebKit2WebExtension' object has no attribute 'get_page'
        web_page = WebKit2WebExtension.get_page(page_id)
        print((web_page))

    def javascript_finished(self, webview, result, user_data):
        # https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebView.html#webkit-web-view-run-javascript-finish
        js_result = self.run_javascript_finish(result)
        print((">>> js_result = %s" % str(js_result)))
        # TypeError: Couldn't find foreign struct converter for 'JavaScriptCore.Value'
        value = js_result.get_value()
        print((">>> value = %s" % str(value)))

    def on_decide_policy(self, webview, decision, decision_type):
        # User clicked on a <a href link: open uri in new tab or new default webview
        if (decision_type == WebKit2.PolicyDecisionType.NAVIGATION_ACTION):
            action = decision.get_navigation_action()
            action_type = action.get_navigation_type()
            if action_type == WebKit2.NavigationType.LINK_CLICKED:
                decision.ignore()
                uri = action.get_request().get_uri()
                # Open link in default browser
                webbrowser.open_new_tab(uri)
        else:
            if decision is not None:
                decision.use()

    def on_load_changed(webview, event):
        # TODO: get html of loaded page
        if event == WebKit2.LoadEvent.FINISHED:
            resource = webview.get_main_resource()
            resource.get_data()
            html = resource.get_data_finish(None)
            print(html)

    def on_load_failed(webview, event, url, error):
        print("Error loading", url, "-", error)

html = '<html><body style="background-color:#E6E6E6;"><h1>WebKit2 Test</h1>' \
       '<p><a href="https://solydxk.com">link</a></p><form onsubmit="return false;">' \
       '<input type="checkbox" name="chktst" value="checkbox1" checked /> CheckBox 1<br />' \
       '<input type="checkbox" name="chktst" value="checkbox2" /> CheckBox 2<br />' \
       '<button onclick="alert(show_values());">JS Show Values</button>' \
       '</form>' \
       '<script>' \
       'function show_values() {' \
       'var e = document.getElementsByName("chktst"); var r = []; var c = 0;' \
       'for (var i = 0; i < e.length; i++) {' \
       '    if (e[i].checked) { r[c] = e[i].value; c++;}' \
       '}return r;}' \
       '</script>' \
       '</body></html>'


win = Gtk.Window()
win.connect("delete-event", Gtk.main_quit)
win.set_default_size(600,400)

webview = SimpleBrowser()
webview.show_html(html)
box = Gtk.Box.new(Gtk.Orientation.VERTICAL, 0)
button = Gtk.Button(label="Python Show Values")
button.connect("clicked", webview.get_element_values, 'chktst')

win.add(box)
box.pack_start(webview, True, True, 0)
box.pack_start(button, False, False, 1)

win.show_all()

Gtk.main() 

[EDIT2]

В Debian Stretch вам необходимо установить пакеты из backports:

sudo apt-get install -t stretch-backports gir1.2-javascriptcoregtk-4.0 gir1.2-webkit2-4.0 libjavascriptcoregtk-4.0-18 libwebkit2gtk-4.0-37  libwebkit2gtk-4.0-37-gtk2

Теперь WebKit2.JavascriptResult.get_js_value() вернет объект JavaScriptCore.Value. Я проверю это дальше и отправлю ответ, если найду его.

Проверьте этот отчет об ошибке: https://bugs.webkit.org/show_bug.cgi?id=136989

1 ответ

  self.webView.run_javascript("document.documentElement.outerHTML", None, self.on_file_save_finish, None)

def on_file_save_finish(self, webview, result, user_data=None):
  document_html = self.webView.run_javascript_finish(result).get_js_value().to_string()

Здесь это используется в KeiEditor.py

https://github.com/orchardguides/Kei-HTML-Editor

Я узнал, что если я верну getElementsByClassName Сам объект выдает следующую ошибку:

Ошибка GLib.Error: WebKitJavascriptError: (699)

Что только говорит мне, что это не удалось.

Однако я мог бы позволить функции JavaScript возвращать строку или массив со значениями и преобразовывать их в строку в Python.

Не идеал, но он подходит для того, что мне нужно.

Вот пример кода (проверьте комментарии для получения дополнительной информации):

#! /usr/bin/env python3

# WebKit2 reference: https://webkitgtk.org/reference/webkit2gtk/stable

import gi
gi.require_version('Gtk', '3.0')
gi.require_version('WebKit2', '4.0')
from gi.repository import Gtk
from gi.repository import WebKit2
from gi.repository import GObject
from os.path import exists
import webbrowser
import re
import sys


class SimpleBrowser(WebKit2.WebView):
    # Create custom signals
    __gsignals__ = {
        "js-finished" : (GObject.SignalFlags.RUN_LAST, GObject.TYPE_NONE, ()),
        "html-response-finished" : (GObject.SignalFlags.RUN_LAST, GObject.TYPE_NONE, ())
    }

    def __init__(self):
        WebKit2.WebView.__init__(self)

        # Get version
        webkit_ver = WebKit2.get_major_version(), WebKit2.get_minor_version(), WebKit2.get_micro_version()
        print(("WebKit2 Version: {0}".format('.'.join(map(str, webkit_ver)))))
        if webkit_ver[0] < 2 or \
           webkit_ver[1] < 22:
               print(("ERROR: upgrade WebKit2 to version 2.22.x or higher"))
               sys.exit()

        # Store JS output
        self.js_value = None
        # Store html response
        self.html_response = None

        # WebKit2 Signals
        self.connect('decide-policy', self.on_decide_policy)
        self.connect("load_changed", self.on_load_changed)
        self.connect("load-failed", self.on_load_failed)
        self.connect('button-press-event', lambda w, e: e.button == 3)

        # Settings
        s = self.get_settings()
        s.set_property('allow_file_access_from_file_urls', True)
        s.set_property('enable-spatial-navigation', False)
        s.set_property('enable_javascript', True)

    def show_html(self, html_or_url):
        if exists(html_or_url):
            matchObj = re.search('^file:\/\/', html_or_url)
            if not matchObj:
                html_or_url = "file://{0}".format(html_or_url)
        matchObj = re.search('^[a-z]+:\/\/', html_or_url)
        if matchObj:
            self.load_uri(html_or_url)
        else:
            self.load_html(html_or_url)
        self.show()

    def js_run(self, function_name, js_return=True):
        # JavaScript
        # https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebView.html#webkit-web-view-run-javascript
        run_js_finish = self._js_finish if js_return else None
        self.run_javascript(function_name, None, run_js_finish, None);

    def _js_finish(self, webview, result, user_data=None):
        # https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebView.html#webkit-web-view-run-javascript-finish
        js_result = self.run_javascript_finish(result)
        if js_result is not None:
            # https://webkitgtk.org/reference/jsc-glib/stable/JSCValue.html

            # TypeError: Couldn't find foreign struct converter for 'JavaScriptCore.Value':
            # Make sure you have WebKit2 2.22.x or higher installed.
            # For Debian Stretch you need the backports packages:
            # apt install -t stretch-backports gir1.2-javascriptcoregtk-4.0 gir1.2-webkit2-4.0 libjavascriptcoregtk-4.0-18 libwebkit2gtk-4.0-37  libwebkit2gtk-4.0-37-gtk2

            # Couldn't handle anything but string :(
            # If returning the getElementsByClassName object itself: GLib.Error: WebKitJavascriptError:  (699)
            value = js_result.get_js_value()
            self.js_value = value.to_string()
            #print((self.js_value))
            self.emit('js-finished')

    def on_decide_policy(self, webview, decision, decision_type):
        # User clicked on a <a href link: open uri in new tab or new default webview
        if (decision_type == WebKit2.PolicyDecisionType.NAVIGATION_ACTION):
            action = decision.get_navigation_action()
            action_type = action.get_navigation_type()
            if action_type == WebKit2.NavigationType.LINK_CLICKED:
                decision.ignore()
                uri = action.get_request().get_uri()
                # Open link in default browser
                webbrowser.open_new_tab(uri)
        else:
            if decision is not None:
                decision.use()

    def on_load_changed(self, webview, event):
        # Get html of loaded page
        if event == WebKit2.LoadEvent.FINISHED:
            resource = webview.get_main_resource()
            resource.get_data(None, self._get_response_data_finish, None)

    def  _get_response_data_finish(self, resource, result, user_data=None):
        self.html_response = resource.get_data_finish(result)
        self.emit('html-response-finished')

    def on_load_failed(webview, event, url, error):
        print("Error loading", url, "-", error)

html = '<html>' \
       '<script>' \
       'function get_checked_values(class_name) {' \
       'var e = document.getElementsByClassName(class_name); var r = []; var c = 0;' \
       'if (e.length == 0) { e = document.getElementsById(class_name); }' \
       'for (var i = 0; i < e.length; i++) {' \
       '    if (e[i].checked) { r[c] = e[i].value; c++;}' \
       '}return r;}' \
       '</script>' \
       '</head><body style="background-color:#E6E6E6;"><h1>WebKit2 JavaScript Test</h1>' \
       '<p><a href="https://solydxk.com">link</a></p><form onsubmit="return false;">' \
       '<input type="checkbox" class="chktst" value="checkbox1" checked /> CheckBox 1<br />' \
       '<input type="checkbox" class="chktst" value="checkbox2" /> CheckBox 2<br />' \
       '</form></body></html>'

# Create test window
win = Gtk.Window()
webview = SimpleBrowser()
win.set_default_size(600,400)
button = Gtk.Button(label="Python Show Checked Values")
box = Gtk.Box.new(Gtk.Orientation.VERTICAL, 0)
box.pack_start(webview, True, True, 0)
box.pack_start(button, False, False, 1)
win.add(box)

# Functions
def get_element_values(self, element_name):
    webview.js_run('get_checked_values("{0}")'.format(element_name))

def show_js_value(object):
    print((webview.js_value))

def show_html_response(object):
    print((webview.html_response))

# Signals
win.connect("delete-event", Gtk.main_quit)
button.connect("clicked", get_element_values, 'chktst')
webview.connect("js-finished", show_js_value)
#webview.connect("html-response-finished", show_html_response)

# Load html and show window
webview.show_html(html)
win.show_all()

Gtk.main() 
Другие вопросы по тегам