Ошибка трассировки стека HTMLcleaner

Я работаю над проектом и столкнулся с проблемой. Я пытаюсь разобрать html с помощью html cleaner и затем использовать xpath для возврата строки. Я заставил его вернуть трассировку стека, если он обнаружил ошибку (что он и сделал). Я действительно понятия не имею, как идти отладки на основе трассировки стека. Вот код

package ru.habrahabr.stackparser;

import java.net.URL;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

import org.htmlcleaner.TagNode;

import android.app.Activity;
import android.app.ProgressDialog;
import android.os.AsyncTask;
import android.os.Bundle;
import android.view.View;
import android.view.View.OnClickListener;
import android.widget.*;

public class stackParser extends Activity {
/** Called when the activity is first created. */
@Override
public void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.main);

    Button button = (Button) findViewById(R.id.parse);
    button.setOnClickListener(myListener);
}


private ProgressDialog pd;

private OnClickListener myListener = new OnClickListener() {
    public void onClick(View v) {
        pd = ProgressDialog.show(stackParser.this, "Working...",
                "request to server", true, false);
        new parseSite()
                .execute("http://wiki.teamliquid.net/starcraft2/3_Gate_Robo");
    }
};

private class parseSite extends AsyncTask<String, Void, String> {
    protected String doInBackground(String... arg) {
        String output = new String();
        try {
            htmlHelper hh = new htmlHelper(new URL(arg[0]));
            output = hh.htmlHelper(arg[0]);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return output;
    }


    protected void onPostExecute(String output) {
        pd.dismiss();
        TextView view = (TextView) findViewById(R.id.tv1);
        view.setText(output);

    }
}

Вот мой вспомогательный класс HTML

package ru.habrahabr.stackparser;

import java.io.IOException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;

import org.htmlcleaner.CleanerProperties;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
import org.htmlcleaner.XPatherException;

public class htmlHelper {
TagNode rootNode;

public htmlHelper(URL url) {
    // TODO Auto-generated constructor stub
}

public String htmlHelper(String arg) throws IOException, XPatherException
{
    CleanerProperties props = new CleanerProperties();

    // set some properties to non-default values
    props.setTranslateSpecialEntities(true);
    props.setTransResCharsToNCR(true);
    props.setOmitComments(true);

    HtmlCleaner cleaner = new HtmlCleaner(props);
    rootNode = cleaner.clean(arg);

    Object[] nodes = rootNode.evaluateXPath("//h1[@id='firstHeading']");

    String things = nodes.toString();

    return things;
}

Пользовательский интерфейс и панель загрузки работают нормально, но TextView продолжает возвращаться [Ljava.lang.Object;@42455a88

Я был бы очень признателен за помощь в этом... Я боролся с этим весь день и не могу понять это. Спасибо!

2 ответа

Решение

Я понял. Запрос Xpath ссылался на дерево DOM в документе XML. Таким образом, чтобы избежать бросков, дерево DOM необходимо инициализировать после очистки. Тогда Xpath будет работать.

Попробуй как читать Text from TagNode:

Object[] nodes = rootNode.evaluateXPath("//h1[@id='firstHeading']");
if(nodes == null || nodes.length < 1) {
    return "";
}

TagNode tagnode = (TagNode)nodes[0];
String things = tagnode.getText();
Другие вопросы по тегам