获取html字符串中第一张图片的路径以及获取html字符串中的文字内容(去掉标签)
/** * 获取html字符串中第一张图片的路径 * @param htmlcontent * @return */ public static String getImgFromHtml(String htmlcontent){ if(htmlcontent!=null){ String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>"; Pattern p_image = Pattern.compile(regEx_img,Pattern.CASE_INSENSITIVE); Matcher m_image = p_image.matcher(htmlcontent); if(m_image.find()){ String img = m_image.group(0); Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img); if(m.find()){ if(m.group(0)!=null){ return m.group(0).substring(5, m.group(0).length()-1); } } } } return ""; } /** * 获取html字符串中的文字内容(去掉标签) * @param htmlcontent * @return */ public static String getContentFromHtml(String htmlcontent){ if(htmlcontent!=null){ return htmlcontent.replaceAll("<\\/?.+?>", ""); } return ""; }
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。