码迷,mamicode.com
首页 > Web开发 > 详细

解析html

时间:2015-10-30 14:01:07      阅读:140      评论:0      收藏:0      [点我收藏+]

标签:

//解析html

package com.xh.tx.html;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;

import android.app.Activity;
import android.os.Bundle;
import android.view.Menu;
import android.view.MenuItem;
import android.widget.TextView;
import android.widget.Toast;

public class MainActivity extends Activity {

TextView tv_html_content = null;

@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);

tv_html_content = (TextView) findViewById(R.id.tv_html_content);

loadHtml("http://10.0.2.2:8080/baidu/");
}

//加载html
public void loadHtml(String uri)
{

try {
final URL url = new URL(uri);

new Thread(new Runnable() {

@Override
public void run() {
HttpURLConnection conn = null;
try {

conn = (HttpURLConnection) url.openConnection();

conn.setConnectTimeout(30000);
conn.setReadTimeout(30000);
conn.setRequestMethod("GET");//以get的方式去请求数据,如果没有这句话,默认就是以get方式请求

conn.connect(); //连接
/**
* 网络连接是否一定成功? 》》 否定的
* 如何判断网络一定成功 >> 在http请求中有一个状态来标示网络是否成功
*/
if(conn.getResponseCode() == 200)
{
final String content = releaseInputStream(conn.getInputStream());
//非要打印一句话
runOnUiThread(new Runnable() {

@Override
public void run() {

if(null == content)
{

Toast.makeText(MainActivity.this, "加载网页源代码失败", 0).show();
}else
{
tv_html_content.setText(content);
}
}
});
}

} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}finally
{
if(null != conn)
{
conn.disconnect();
}
}
}
}).start();

} catch (MalformedURLException e1) {
e1.printStackTrace();
}

}

public String releaseInputStream(InputStream in) throws IOException
{
byte[] buffer = new byte[1024];
ByteArrayOutputStream bytearray = new ByteArrayOutputStream();
int len = 0;

if(null == in)
{
return null;
}else
{
//正常解析
while((len = in.read(buffer, 0, 1024)) != -1)
{
bytearray.write(buffer);
}

String content = bytearray.toString();
if(content.indexOf("GBK") != -1 || content.indexOf("gbk") != -1)
{
//content = new String(content.getBytes(),"gbk");
//中国 》》 01 10
//只针对网页 解决乱码问题
/**
* 总结乱码问题:
* 以后做项目统一几个编码
* 1. 项目的编码
* 2. 网络编码
* 3. 获取的时候流的编码
* 4. 数据库的编码
*/
content = new String(bytearray.toByteArray(),"GBK");

}

bytearray.close();
return content;
}
}

}

解析html

标签:

原文地址:http://www.cnblogs.com/wt-w/p/4922979.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!