当前位置 博文首页 > kezhou的博客:leetcode刷题(19)——820.单词的压缩编码

    kezhou的博客:leetcode刷题(19)——820.单词的压缩编码

    作者:[db:作者] 时间:2021-08-24 13:34

    一、题目

    给定一个单词列表,我们将这个列表编码成一个索引字符串 S 与一个索引列表 A。

    例如,如果这个列表是 [“time”, “me”, “bell”],我们就可以将其表示为 S = “time#bell#” 和 indexes = [0, 2, 5]。

    对于每一个索引,我们可以通过从字符串 S 中索引的位置开始读取字符串,直到 “#” 结束,来恢复我们之前的单词列表。

    那么成功对给定单词列表进行编码的最小字符串长度是多少呢?

    示例:

    输入: words = [“time”, “me”, “bell”]
    输出: 10
    说明: S = “time#bell#” , indexes = [0, 2, 5] 。

    提示:

    1 <= words.length <= 2000
    1 <= words[i].length <= 7
    每个单词都是小写字母 。

    二、思路

    分析:

    如果单词 X 是 Y 的后缀,则在编码时就可以不用再对 X 编码,因为它可以用 Y 的后缀来表示;如果单词 X 不是单词列表中其它任何单词的后缀,那么 X 就必须编码到索引字符串中。

    例如:

    单词列表是 [“time”, “me”, “bell”],“me” 是 “time” 的后缀,编码时就不用再考虑 “me”,“time” 和 “bell” 不是其它单词的后缀,都要编码到索引字符串中,得到 “time#bell#”,长度为 10。

    所以,我们的目标就是删除单词列表中那些是其它单词的后缀的单词,留下的单词都是要编码到索引字符串中的。

    三、代码

    class Solution {
        public int minimumLengthEncoding(String[] words) {
            Set<String> wordSet = new HashSet<String>(Arrays.asList(words));
            for(String word : words){
                for(int i = 1; i < word.length(); i++){
                    wordSet.remove(word.substring(i));
                }
            }
            int length = 0;
            for(String s : wordSet){
                length += s.length() + 1;
            }
            return length;
        }
    }
    
    cs