罗马字标音 #15

yanyin1986 · 2019-07-23T02:19:02Z

let text = "８年前、東京電力福島第一原発で事故がありました。事故のあと、福島県では、放射線を出す物質で汚れた土や草、木などを取る作業をしています。"
        print(text)
        let tokens = Tokenizer.tokenize(text: text)
        for t in tokens {
            let locale = CFLocaleCreate(kCFAllocatorDefault,
                                        CFLocaleIdentifier("japanese" as CFString))
            let tokenizer = CFStringTokenizerCreate(kCFAllocatorDefault,
                                                    t as CFString,
                                                    CFRangeMake(0, t.count),
                                                    kCFStringTokenizerUnitWord,
                                                    locale)!
            var result = CFStringTokenizerAdvanceToNextToken(tokenizer)
            while result != .none {
                let r = CFStringTokenizerCopyCurrentTokenAttribute(tokenizer,
                                                                   kCFStringTokenizerAttributeLatinTranscription)
                if let rr = r {
                    let rrr = (r as! String).applyingTransform(.latinToHiragana, reverse: false)
                    print("\(t) => \(rr) => \(rrr!)")
                } else {
                    break
                }
                result = CFStringTokenizerAdvanceToNextToken(tokenizer)
            }
        }

struct Tokenizer {

    // MARK: - Publics
    static func tokenize(text: String) -> [String] {
        var tokens: [String] = []
        text.enumerateSubstrings(in: text.startIndex ..< text.endIndex, options: .byWords) { (subString, _, _, _) in
            if let substring = subString {
                tokens.append(substring)
            }
        }
        return tokens
    }
}

yanyin1986 added iOS issue for iOS client type: enhancement New feature or request labels Jul 23, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

罗马字标音 #15

罗马字标音 #15

yanyin1986 commented Jul 23, 2019

罗马字标音 #15

罗马字标音 #15

Comments

yanyin1986 commented Jul 23, 2019