Получение страницы URL с помощью luasocket и прокси
Пока что у меня есть следующий кусок:
local socket = require "socket.http"
client,r,c,h = socket.request{url = "http://example.com/", proxy="<my proxy and port here>"}
for i,v in pairs( c ) do
print( i, v )
end
который дает мне вывод, как показано ниже:
connection close
content-type text/html; charset=UTF-8
location http://www.iana.org/domains/example/
vary Accept-Encoding
date Tue, 24 Apr 2012 21:43:19 GMT
last-modified Wed, 09 Feb 2011 17:13:15 GMT
transfer-encoding chunked
server Apache/2.2.3 (CentOS)
что означает, что соединение установлено просто отлично. Теперь я хочу получить название моего url's
используя это socket.http
, Я искал предыдущие вопросы SO и http-документацию luasocket. но я до сих пор не знаю, как извлечь / сохранить всю / часть страницы в переменной и что-то с ней сделать.
Пожалуйста помоги.
1 ответ
Решение
Вы используете "общую" форму http.request(), которая требует хранения тела через приемник LTN12. Это не так сложно, как кажется, попробуйте этот код:
local socket = require "socket.http"
local ltn12 = require "ltn12"; -- LTN12 lib provided by LuaSocket
-- This table will store the body (possibly in multiple chunks):
local result_table = {};
client,r,c,h = socket.request{
url = "http://example.com/",
sink = ltn12.sink.table(result_table),
proxy="<my proxy and port here>"
}
-- Join the chunks together into a string:
local result = table.concat(result_table);
-- Hacky solution to extract the title:
local title = result:match("<[Tt][Ii][Tt][Ll][Ee]>([^<]*)<");
print(title);
Если ваш прокси-сервер постоянен во всем приложении, то более простым решением будет использование простой формы http.request () и указание прокси-сервера через http.PROXY:
local http = require "socket.http"
http.PROXY="<my proxy and port here>"
local result = http.request("http://www.youtube.com/watch?v=_eT40eV7OiI")
local title = result:match("<[Tt][Ii][Tt][Ll][Ee]>([^<]*)<");
print(title);
Выход:
Flanders and Swann - A song of the weather
- YouTube