Android富文本编辑器（四）：HTML文本转换

作者: InnerNight | 来源:发表于2016-06-07 19:11 被阅读5019次

Angular 设置string文本以html文本解析显示
Android富文本编辑器（四）：HTML文本转换
根据Html文本设置控件的尺寸
2.8 输入控件（二）
django2.0学习笔记2(哔哩哔哩杨世航)
前端知识 | 富文本编辑器 React-draft-wysiwy
这是一篇测试文章
每日前端签到（第112天）
HTML字符串和iOS富文本转换
RichEditeText——android图文混排富文本文章编

在真实的工程开发中，一个富文本编辑器，不是仅仅可以编辑显示，还需要处理富文本的转换与解析，方便传输与存储。一般来说，HTML文本是比较理想的网络传输格式。如何将安卓的span式富文本和HTML文本之间进行互转，是本篇介绍的重点。
首先，介绍富文本转成HTML。我们需要做的，是遍历文本中的span对象，并用合适的html标签来修饰span对象对应的文本。示例代码如下：

public static String convertSpannedToRichText(Spanned spanned) {
    List<CharacterStyle> spanList =
            Arrays.asList(spanned.getSpans(0, spanned.length(), CharacterStyle.class));
    SpannableStringBuilder stringBuilder = new SpannableStringBuilder(spanned);
    for (CharacterStyle characterStyle : spanList) {
        int start = stringBuilder.getSpanStart(characterStyle);
        int end = stringBuilder.getSpanEnd(characterStyle);
        if (start >= 0) {
            String htmlStyle = handleCharacterStyle(characterStyle,
                    stringBuilder.subSequence(start, end).toString());
            if (htmlStyle != null) {
                stringBuilder.replace(start, end, htmlStyle);
            }
        }
    }
    return stringBuilder.toString();
}

private static String handleCharacterStyle(CharacterStyle characterStyle, String text) {
    if (characterStyle instanceof BoldSpan) {
        return String.format("<b>%s</b>", text);
    } else if (characterStyle instanceof UrlSpan) {
        UrlSpan span = (UrlSpan) characterStyle;
        return String.format("<a href=\"%s\">%s</a>", span.getValue(), text);
    } else if (characterStyle instanceof EmojiSpan) {
        EmojiSpan span = (EmojiSpan) characterStyle;
        return String.format("<img src=\"%s\" alt=\"[%s]\" class=\"yiqiFace\"/>",
                span.getUrl(), span.getName());
    } else if (characterStyle instanceof FakeImageSpan) {
        FakeImageSpan span = (FakeImageSpan) characterStyle;
        return String.format("<img src=\"%s\" />", span.getValue());
    } if (characterStyle instanceof ImageSpan) {
        ImageSpan span = (ImageSpan) characterStyle;
        return String.format("<img src=\"%s\" />", TextUtils.isEmpty(span.getUrl()) ?
                span.getFilePath() : span.getUrl());
    }
    return null;
}

注：上述代码在处理一些复杂的span嵌套情况时，可能会有问题。如果要考虑到span嵌套的情况，可能需要全新的思路和写法。后续如果有改进会再更新。
下面介绍如何将HTML转化为安卓富文本。这里使用了一个开源库：TagSoup，来处理Html内容的解析。TagSoup是一个解析HTML的java开源库，一般用作HTML的正则化。TagSoup的介绍可以参考网上其它文章，这里不再赘述。而我们要做的，是实现自己的SAX内容处理器，实现org.xml.sax.ContentHandler接口，并set到TagSoupParser中。具体代码都在:RichTextConvertor这个类中。下面节选几个比较重要的方法：

@Override
public void startElement(String uri, String localName, String qName, Attributes atts) throws SAXException {
    handleStartTag(localName, atts);
}

@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
    handleEndTag(localName);
}

@Override
public void characters(char[] ch, int start, int length) throws SAXException {
    StringBuilder sb = new StringBuilder();

    for (int i = 0; i < length; i++) {
        char c = ch[i + start];
        sb.append(c);
    }

    mResult.append(sb);
}

// ****************************************** Handle Tags *******************************************

private void handleStartTag(String tag, Attributes attributes) {
    if (tag.equalsIgnoreCase("a")) {
        startAHref(attributes);
    } else if (tag.equalsIgnoreCase("img")) {
        startImg(attributes);
    } else if (tag.equalsIgnoreCase("b") || tag.equalsIgnoreCase("strong")) {
        start(new Bold());
    }
}

private void handleEndTag(String tag) {
    if (tag.equalsIgnoreCase("a")) {
        endAHref();
    } else if (tag.equalsIgnoreCase("b")|| tag.equalsIgnoreCase("strong")) {
        end(Bold.class, new BoldSpan());
    }
}

private void startAHref(Attributes attributes) {
    String href = attributes.getValue("", "href");
    int len = mResult.length();
    mResult.setSpan(new Href(href), len, len, Spanned.SPAN_MARK_MARK);
}

private void start(Object mark) {
    int len = mResult.length();
    mResult.setSpan(mark, len, len, Spanned.SPAN_MARK_MARK);
}

private void endAHref() {
    int len = mResult.length();
    Object obj = getLast(Href.class);
    int where = mResult.getSpanStart(obj);

    mResult.removeSpan(obj);

    if (where != len) {
        Href h = (Href) obj;
        if (h.mHref != null) {
            mResult.setSpan(new UrlSpan(h.mHref),
                    where, len, Spanned.SPAN_EXCLUSIVE_EXCLUSIVE);
        }
    }
}

private void end(Class<? extends Object> kind, Object repl) {
    int len = mResult.length();
    Object obj = getLast(kind);
    int where = mResult.getSpanStart(obj);

    mResult.removeSpan(obj);

    if (where != len) {
        // Note: use SPAN_EXCLUSIVE_EXCLUSIVE, the TemporarySpan will be replaced by a SPAN_EXCLUSIVE_INCLUSIVE span
        mResult.setSpan(new TemporarySpan(repl), where, len, Spanned.SPAN_EXCLUSIVE_EXCLUSIVE);
    }
}

private Object getLast(Class<? extends Object> kind) {
    /*
     * This knows that the last returned object from getSpans()
     * will be the most recently added.
     */
    Object[] objs = mResult.getSpans(0, mResult.length(), kind);
    return objs.length == 0 ? null : objs[objs.length - 1];
}

private void startImg(Attributes attributes) {
    int len = mResult.length();
    String alt = attributes.getValue("", "alt");
    String src = attributes.getValue("", "src");
    String classString = attributes.getValue("", "class");

    // Unicode Character 'OBJECT REPLACEMENT CHARACTER' (U+FFFC)
    // see http://www.fileformat.info/info/unicode/char/fffc/index.htm
    mResult.append("\uFFFC");
    FakeImageSpan imageSpan = new FakeImageSpan(src);
    mResult.setSpan(imageSpan, len, len + 1, Spanned.SPAN_EXCLUSIVE_EXCLUSIVE);
}

private static class Bold {
}

这里需要分三种情况进行讨论：

对于img这种标签，我们取出其中的属性，就可以进行替换（有的读者可能发现，在img标签的处理上，我使用了一个叫做FakeImageSpan的类。这时因为在传输、存储过程中，图片都是使用了url远程路径或者本地路径，需要先进行下载或加载，才可以使用真正的ImageSpan进行替换）；
对于href这种标签，需要先读取内容，直到出现截止标签，再用真正的URL内容替换掉占位span；
对于b和strong这样的标签，先用占位span占位后，在替换成TemporarySpan，并采用SPAN_EXCLUSIVE_EXCLUSIVE格式。在后面处理完所有输入后，统一替换成相应得span，并采取SPAN_EXCLUSIVE_INCLUSIVE格式，这样后续的输入都会采用相同的格式。具体的处理请参考RichTextConvertor。

网友评论

e24971cb401e:很多html转span的但是很少见到span转html的。这个很有帮助, 虽然我要转markdown但是很类似了
352956c59158:你图片url地址不加" width="100%"，手机拍照图片显示不对
gg小李:楼主您的demo没法插入图片啊，是我下载的地址不对吗
InnerNight:没法插入图片是指？因为插入图片需要调用图片页面，涉及到读取系统图库等操作，可能我的工程里没有具体实现，只有一个入口。
52220136adbe:估计会很有帮助 html2rtf
无奈的冻鱼:不错哦，span用过不少次，都是小范围使用，富文本编辑器还真没想过

本文标题：Android富文本编辑器（四）：HTML文本转换

本文链接：https://www.haomeiwen.com/subject/kdcddttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Android富文本编辑器（四）：HTML文本转换

相关文章

Angular 设置string文本以html文本解析显示