requiredirname(__FILE__).'/simple_html_dom.php';
$html=file_get_html('
$articles=array();
foreach($html->find('article.newsentry')as$article){
$item['time']=trim($article->find('time',0)->plaintext);
$item['title']=trim($article->find('h2.newstitle',0)->plaintext);
$item['content']=trim($article->find('div.newscontent',0)->plaintext);
$articles[]=$item;
}
print_r($articles);
可以把抓取到的内容写入置于内存上的SQLite(/run/shm/php/crawler.db3),避免频繁的磁盘IO.