Как настроить HtmlUnit в проекте Eclipse?
Мой проект включает htmlunit jars и загружает содержимое некоторых страниц. Однако исполняемый файл jar (который включает libs, функцию экспорта eclipse) работает только на той машине, на которой я его создал (на другой он не выполняется).
РЕДАКТИРОВАТЬ: он не выполняется, так как он не показывает "Запуск без браузера" MessageBox при запуске. Я использовал Eclipse Indigo: File > Export > Runnable jar > пакет необходимых библиотек в сгенерированный jar
Помогите, боги
import java.io.*;
import com.gargoylesoftware.htmlunit.BrowserVersion;
import com.gargoylesoftware.htmlunit.Page;
import com.gargoylesoftware.htmlunit.RefreshHandler;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlPage;
import com.gargoylesoftware.htmlunit.html.HtmlTextInput;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import javax.swing.*;
import javax.swing.filechooser.FileSystemView;
РЕДАКТИРОВАТЬ: дополнительный код, как требуется
public class MyTest
{
public static void main(String[] arguments) {
try{
JOptionPane.showMessageDialog(null, "Starting Headless Browser");
JFileChooser fr = new JFileChooser();
FileSystemView fw = fr.getFileSystemView();
String MyDocuments = fw.getDefaultDirectory().toString();
FileInputStream fstream = new FileInputStream(MyDocuments+"\\Links.txt");
DataInputStream in = new DataInputStream(fstream);
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String strLine;
String strLineID;
FileWriter xfstream = new FileWriter(MyDocuments+"\\NewPageContentList.txt");
BufferedWriter out = new BufferedWriter(xfstream);
while ((strLineID = br.readLine()) != null) {
strLine = br.readLine();
out.write(strLineID);
out.write("\r\n");
out.write(DownloadPage(strLine));
out.write("\r\n");
}
out.close();
in.close();
JOptionPane.showMessageDialog(null, "HeadLess Browser Process Has Finished");
}
catch (Exception e){
JOptionPane.showMessageDialog(null, "error");
}
}
public static String DownloadPage(String str){
final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_3_6);
webClient.setThrowExceptionOnScriptError(false);
try{
final HtmlPage page = webClient.getPage(str);
final String pageAsText = str_replace("\n","",str_replace("\r","",page.asText()));
return pageAsText;
}
catch(IOException e){
JOptionPane.showMessageDialog(null, "error");
}
webClient.closeAllWindows();
return "";
}
public static String str_replace (String search, String replace, String subject)
{
StringBuffer result = new StringBuffer (subject);
int pos = 0;
while (true)
{
pos = result.indexOf (search, pos);
if (pos != -1)
result.replace (pos, pos + search.length (), replace);
else
break;
}
return result.toString ();
}
}
3 ответа
Вот как настроить HtmlUnit и экспортировать его в исполняемый файл JAR в eclipse:
- Создать новый проект Java (все настройки по умолчанию)
- Щелкните правой кнопкой мыши по проекту (в представлении проводника пакетов) и перейдите в New->Folder и назовите его "lib".
- Загрузить библиотеку HtmlUnit (файл htmlunit-2.9-bin.zip)
- Распакуйте его и скопируйте в нашу папку "lib" содержимое папки "/htmlunit-2.9/lib/" несжатого файла (вы можете перетащить с рабочего стола Windows/ Linux все файлы в проводнике пакетов eclipse и выбрать для копирования файлы)
- Снова щелкните правой кнопкой мыши по проекту и перейдите в Build Path->Configure Build Path...
- На вкладке Библиотеки нажмите Добавить JAR...
- Ищите нашу новую папку библиотеки (если вы не видите ее, закройте окно и снова перейдите в проводник пакетов, выберите папку проекта и нажмите F5 и продолжайте с шага 5)
- Выберите все файлы в этой папке (17 файлов в HtmlUnit 2.9) и закройте все окна
- Проверьте, все ли в порядке, создав очень простое приложение (в этом вопросе я написал простой код, который может вам помочь)
- Все должно быть хорошо (если это не так, перепроверьте шаги), поэтому давайте экспортируем приложение, щелкнув правой кнопкой мыши по проекту и выбрав Export...
- Найдите файл Java/Runnable JAR и нажмите "Далее".
- Выберите подходящую конфигурацию запуска, место назначения и выберите "Упаковать необходимые библиотеки в сгенерированный JAR", если вам нужен только один большой файл, содержащий ваше приложение и HtmlUnit, и нажмите "Готово".
- Откройте консоль, где находится ваш JAR-файл, выполните "java -jar yourJARfile.jar" и наслаждайтесь вашим приложением
Если это сработало для нового проекта, обновите свой собственный проект, чтобы отразить шаги, сделанные в списке. Надеюсь это поможет
Новый проект Java с настройками по умолчанию. Загрузите библиотеку последней версии HTMUnit из раздела Загрузка последней версии HTMLUnit jar. Выберите свойства нового проекта- > Путь сборки Java -> перейдите на вкладку библиотеки и добавьте извлеченные все файлы jars. Создайте новый класс с методом main в вашем новом проекте, запустите простое приложение, добавьте этот метод в класс и вызовите его в методе main.
`@Test
public void getElements() throws Exception {
final WebClient webClient = new WebClient();
final HtmlPage page = webClient.getPage("http://some_url");
final HtmlDivision div = page.getHtmlElementById("some_div_id");
final HtmlAnchor anchor = page.getAnchorByName("anchor_name");
webClient.closeAllWindows();
}`
Я попробовал вышеупомянутые ответы, и они не работали для меня.
Они нужны, но у меня был динамический веб-проект, поэтому мне также нужно было добавить все мои файлы.jar в каталог lib в каталоге WEB-INF.
например, ProjectName\WebContent\WEB-INF\lib(все файлы.jar, которые вы используете)