码迷,mamicode.com
首页 > Web开发 > 详细

Object-c 遍历网页获取网页中<img>标签中的图片url

时间:2016-05-07 13:16:05      阅读:673      评论:0      收藏:0      [点我收藏+]

标签:

前言:

 项目中遇见一个需求遍历网页中所有的<img>标签并且去处图片的url

第一步:编写获取<img >标签的正则表达式,代码如下:

-(NSArray*)getImgTags:(NSString *)htmlText
{
    if (htmlText == nil) {
        return nil;
    }

    
    NSError *error;
    NSString *regulaStr = @"<img[^>]+src\\s*=\\s*[‘\"]([^\"]+)[\"][^>]*>";
    NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:regulaStr
                                                                           options:NSRegularExpressionCaseInsensitive
                                                                             error:&error];
    NSArray *arrayOfAllMatches = [regex matchesInString:imageText options:0 range:NSMakeRange(0, [htmlText length])];

    return arrayOfAllMatches;
}

第二步:根据html标签元素获取图片url

-(NSString *)getImageUrl:(NSString *)imgTagStr{  // 提取url
    
    NSData * data = [imgTagStr dataUsingEncoding:NSUTF8StringEncoding];
    TFHpple *doc = [[TFHpple alloc] initWithXMLData:data];
    
    TFHppleElement *e = [doc peekAtSearchWithXPathQuery:@"//img"];
    
    return [self encodeStringFromString:[e objectForKey:@"src"]];
}

 

Object-c 遍历网页获取网页中<img>标签中的图片url

标签:

原文地址:http://www.cnblogs.com/whoislcj/p/5468024.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!