Use all topics to search for keywords in dialogues (Fixes #2013)
Move KeywordSearch to MWDialogue Move hypertext parsing functions to a new fileloadfix
parent
9213067aee
commit
ed6bdc0bde
@ -0,0 +1,89 @@
|
|||||||
|
#include <components/esm/loaddial.hpp>
|
||||||
|
|
||||||
|
#include "../mwbase/environment.hpp"
|
||||||
|
#include "../mwbase/world.hpp"
|
||||||
|
|
||||||
|
#include "../mwworld/store.hpp"
|
||||||
|
#include "../mwworld/esmstore.hpp"
|
||||||
|
|
||||||
|
#include "keywordsearch.hpp"
|
||||||
|
|
||||||
|
#include "hypertextparser.hpp"
|
||||||
|
|
||||||
|
namespace MWDialogue
|
||||||
|
{
|
||||||
|
namespace HyperTextParser
|
||||||
|
{
|
||||||
|
std::vector<Token> parseHyperText(const std::string & text)
|
||||||
|
{
|
||||||
|
std::vector<Token> result;
|
||||||
|
size_t pos_end, iteration_pos = 0;
|
||||||
|
for(;;)
|
||||||
|
{
|
||||||
|
size_t pos_begin = text.find('@', iteration_pos);
|
||||||
|
if (pos_begin != std::string::npos)
|
||||||
|
pos_end = text.find('#', pos_begin);
|
||||||
|
|
||||||
|
if (pos_begin != std::string::npos && pos_end != std::string::npos)
|
||||||
|
{
|
||||||
|
if (pos_begin != iteration_pos)
|
||||||
|
tokenizeKeywords(text.substr(iteration_pos, pos_begin - iteration_pos), result);
|
||||||
|
|
||||||
|
std::string link = text.substr(pos_begin + 1, pos_end - pos_begin - 1);
|
||||||
|
result.push_back(Token(link, Token::ExplicitLink));
|
||||||
|
|
||||||
|
iteration_pos = pos_end + 1;
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
if (iteration_pos != text.size())
|
||||||
|
tokenizeKeywords(text.substr(iteration_pos), result);
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
return result;
|
||||||
|
}
|
||||||
|
|
||||||
|
void tokenizeKeywords(const std::string & text, std::vector<Token> & tokens)
|
||||||
|
{
|
||||||
|
const MWWorld::Store<ESM::Dialogue> & dialogs =
|
||||||
|
MWBase::Environment::get().getWorld()->getStore().get<ESM::Dialogue>();
|
||||||
|
|
||||||
|
std::list<std::string> keywordList;
|
||||||
|
for (MWWorld::Store<ESM::Dialogue>::iterator it = dialogs.begin(); it != dialogs.end(); ++it)
|
||||||
|
keywordList.push_back(Misc::StringUtils::lowerCase(it->mId));
|
||||||
|
keywordList.sort(Misc::StringUtils::ciLess);
|
||||||
|
|
||||||
|
KeywordSearch<std::string, int /*unused*/> keywordSearch;
|
||||||
|
KeywordSearch<std::string, int /*unused*/>::Match match;
|
||||||
|
|
||||||
|
for (std::list<std::string>::const_iterator it = keywordList.begin(); it != keywordList.end(); ++it)
|
||||||
|
keywordSearch.seed(*it, 0 /*unused*/);
|
||||||
|
|
||||||
|
for (std::string::const_iterator it = text.begin(); it != text.end() && keywordSearch.search(it, text.end(), match, text.begin()); it = match.mEnd)
|
||||||
|
tokens.push_back(Token(std::string(match.mBeg, match.mEnd), Token::ImplicitKeyword));
|
||||||
|
}
|
||||||
|
|
||||||
|
size_t removePseudoAsterisks(std::string & phrase)
|
||||||
|
{
|
||||||
|
size_t pseudoAsterisksCount = 0;
|
||||||
|
|
||||||
|
if( !phrase.empty() )
|
||||||
|
{
|
||||||
|
std::string::reverse_iterator rit = phrase.rbegin();
|
||||||
|
|
||||||
|
const char specialPseudoAsteriskCharacter = 127;
|
||||||
|
while( rit != phrase.rend() && *rit == specialPseudoAsteriskCharacter )
|
||||||
|
{
|
||||||
|
pseudoAsterisksCount++;
|
||||||
|
++rit;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
phrase = phrase.substr(0, phrase.length() - pseudoAsterisksCount);
|
||||||
|
|
||||||
|
return pseudoAsterisksCount;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
@ -0,0 +1,36 @@
|
|||||||
|
#ifndef GAME_MWDIALOGUE_HYPERTEXTPARSER_H
|
||||||
|
#define GAME_MWDIALOGUE_HYPERTEXTPARSER_H
|
||||||
|
|
||||||
|
#include <string>
|
||||||
|
#include <vector>
|
||||||
|
|
||||||
|
namespace MWDialogue
|
||||||
|
{
|
||||||
|
namespace HyperTextParser
|
||||||
|
{
|
||||||
|
struct Token
|
||||||
|
{
|
||||||
|
enum Type
|
||||||
|
{
|
||||||
|
ExplicitLink, // enclosed in @#
|
||||||
|
ImplicitKeyword
|
||||||
|
};
|
||||||
|
|
||||||
|
Token(const std::string & text, Type type) : mText(text), mType(type) {}
|
||||||
|
|
||||||
|
bool isExplicitLink() { return mType == ExplicitLink; }
|
||||||
|
bool isImplicitKeyword() { return mType == ImplicitKeyword; }
|
||||||
|
|
||||||
|
std::string mText;
|
||||||
|
Type mType;
|
||||||
|
};
|
||||||
|
|
||||||
|
// In translations (at least Russian) the links are marked with @#, so
|
||||||
|
// it should be a function to parse it
|
||||||
|
std::vector<Token> parseHyperText(const std::string & text);
|
||||||
|
void tokenizeKeywords(const std::string & text, std::vector<Token> & tokens);
|
||||||
|
size_t removePseudoAsterisks(std::string & phrase);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
#endif
|
Loading…
Reference in New Issue