yukiarimo · December 24, 2023 08:07 · yukiarimo · Apr 7, 2023
diff --git a/character-ai-wrapper.py b/character-ai-wrapper.py
 import json
 from bs4 import BeautifulSoup

 with open("Main - Rushia Uruha.html") as fp:
    soup = BeautifulSoup(fp, "html.parser")
    items = []
    main_text = None
    target_text = None
    for tag in soup.find_all("span", class_="s1"):
        text = tag.get_text().strip()
        if text == "Yuki Arimo":
            if target_text:
                items.append({"main_text": main_text, "target_text": target_text})
                main_text = None
                target_text = None
            main_text = ""
        elif text == "Rushia Uruha":
            if main_text:
                items.append({"main_text": main_text, "target_text": target_text})
                main_text = None
                target_text = None
            target_text = ""
        elif tag.name == "img":
            continue
        else:
            if main_text is not None:
                main_text += " " + text
            elif target_text is not None:
                target_text += " " + text

    if main_text or target_text:
        items.append({"main_text": main_text, "target_text": target_text})

    new_list = []
    for i in range(len(items)-1):
        if items[i].get("main_text") and items[i+1].get("target_text"):
            new_dict = {"main_text": items[i].get("main_text"), "target_text": items[i+1].get("target_text")}
            new_list.append(new_dict)
                
    json.dump(new_list, open("output.json", "w"), ensure_ascii=False, indent=4)
	import json
	from bs4 import BeautifulSoup

	with open("Main - Rushia Uruha.html") as fp:
	soup = BeautifulSoup(fp, "html.parser")
	items = []
	main_text = None
	target_text = None
	for tag in soup.find_all("span", class_="s1"):
	text = tag.get_text().strip()
	if text == "Yuki Arimo":
	if target_text:
	items.append({"main_text": main_text, "target_text": target_text})
	main_text = None
	target_text = None
	main_text = ""
	elif text == "Rushia Uruha":
	if main_text:
	items.append({"main_text": main_text, "target_text": target_text})
	main_text = None
	target_text = None
	target_text = ""
	elif tag.name == "img":
	continue
	else:
	if main_text is not None:
	main_text += " " + text
	elif target_text is not None:
	target_text += " " + text

	if main_text or target_text:
	items.append({"main_text": main_text, "target_text": target_text})

	new_list = []
	for i in range(len(items)-1):
	if items[i].get("main_text") and items[i+1].get("target_text"):
	new_dict = {"main_text": items[i].get("main_text"), "target_text": items[i+1].get("target_text")}
	new_list.append(new_dict)

	json.dump(new_list, open("output.json", "w"), ensure_ascii=False, indent=4)