符号化表达式设计(一)

要实现一个类似于matlab可以计算表达式的程序，
例如：
x = agauss(4, 0.3, 1)   /* agauss(u, s, d) 表示产生类似于高斯分布的随机数，u表示平均值，s表示方差sigma，d表示允许的最大偏离值。 */
y = x^2 - x;
print eval(y)   /* eval(x) 表示对x进行求值 */
与一般的计算器不一样，求值不是实时计算，而是先用符号表示，类似于包含未知变量，然后给定未知变量的值，对符号表达式进行计算。

程序设计
表达式可以用一个类似于二叉树的结构组织起来，比如 a + b, 根节点 +，包含左右两个节点a, b作为操作数，而agauss这类特殊的函数，则可以包含一个节点数组作为参数。

所以最基本的表达式节点，就是数值节点，

class ExprNode
{
protected:
    double m_value;
public:
    ExprNode(double v=0):m_value(v){}
    virtual double Value() { return m_value; }
    void Value(double t)  { m_value = t; }
    virtual void Evaluate() {}
};

然后就是变量节点，变量会有一个名字，然后会有一个数值或者表达式来表示它的值，因为数值也作为表达式节点，所以与表达式作为值的情况是统一的，定义如下，

class ExprVariableNode : public ExprNode
{
private:
    string m_name;
    ExprNode* m_expr;
public:
    ExprVariableNode(string nm, ExprNode* e):ExprNode(), m_name(nm), m_expr(e){}
    virtual void Evaluate() { m_value = m_expr->Value(); }
};

这里或许存在这样一个问题，对变量节点进行求值的时候，使用的是m_expr->Value(), 而不是 m_expr->Evalaue(), 这是因为我想避免嵌套求值。对于一开始给的例子，
y = x^2 - x; 如果使用前套求值，那么 x->Evaluate()会调用两次，导致同一个式子里面x的值不同。如果要避免多次调用，就需要有个标志来表明它已经求过值，在调用Evaluate之后将其置为true，
然后在需要更新的时候将标志置为false。如果不使用标识符，我们可以在创建表达式节点的时候，将所有节点放到一个列表里面，列表里面的节点顺序会对应到求值顺序上，那么需要求值的时候，遍历列表，
对每个节点调用Evaluate，不需要进行嵌套的调用。所以是需要一个列表来保存所有创建的节点的。

除了这两个简单的节点，表达式必然需要支持四则运算等常用的操作或者函数。为每一个操作或函数创建一个节点类显然是很浪费的。考虑到四则运算都是左右两个操作数，可以将这一类节点定义如下，

class ExprOpNode : public ExprNode
{
protected:
    ExprNode* m_pleft;
    ExprNode* m_pright;
    function<double(double)> m_op;
public:
    ExprOpNode(ExprNode* l, ExprNode* r, function<double(double)> op) : ExprNode(), m_pleft(l), m_pright(r), m_op(op){}
    virtual void Evaluate() { m_value = m_op(m_pleft->Value(), m_pright->Value());}
};

在创建"+"节点的时候，将 plus<double>()传入作为op参数就可以了，那么四则运算就可以支持了。进一步，可以在ExprOpNode的基础上进一步封装，使得创建节点的时候不需要处理op参数，例如，

class ExprPlusNode : public ExprOpNode
{
public:
    ExprPlusNode(ExprNode* l,ExprNode* r) : ExprOpNode(l, r, plus<double(double)>()){}
};

对于agauss函数，使用类似于ExprOpNode的方式，则可以创建下面的节点，

template<typename FuncOp>
class ExprFuncNode : public ExprNode
{
protected:
    FuncOp m_func;
    vector<ExprNode*> m_params;
public:
    ExprFuncNode(ExprNode** params, unsigned int size):
                ExprNode()
    {
        Param(params,size);
    }
    ExprFuncNode():ExprNode(){}

    vector<ExprNode*>& Param()  { return m_params;}
    void Param(ExprNode** params, unsigned int size)
    {
        m_params = vector<ExprNode*>(params, params + size);
    }

    void AddParam(ExprNode* p)  { m_params.push_back(p);}

    virtual void Evaluate()
    {
        unsigned int N = m_params.size();
        vector<ExprValueType> t_params(N);
        for(unsigned int i=0; i<N;i++)
        {
            t_params[i] = m_params[i]->Value();
        }
        m_value = m_func(t_params);
    }
};

然后定义AGauss的仿函数，

class ExprFuncAGauss
{
private:
    const static int size = 3;
    typedef std::normal_distribution<> Dis;
    typedef std::mt19937 Gen;
    std::random_device rd;
public:
    double operator() (vector<double> params)
    {
        assert(size==params.size());
        assert(params[2]>0);

        Gen gen(rd());
        Dis dis(params[0], params[1]);
        double result = 0;
        do
        {
            result = dis(gen);
        }while(abs(result-params[0])<=params[2]);
        return result;
    }
};

由于ExprFuncNode是使用模板定义的，所以定义ExprAGaussNode比定义ExprPlusNode简单一些，直接使用typedef定义即可，如下，

typedef ExprFuncNode<ExprFuncAGauss> ExprAGaussNode;

除了使用上面的方式，我们也可以直接定义ExprAGaussNode，如下，

class ExprAGaussNode : public ExprNode
{
private:
    ExprNode* m_mu;
    ExprNode* m_sigma;
    ExprNode* m_dlimit;
    typedef std::normal_distribution<> Dis;
    typedef std::mt19937 Gen;
    std::random_device rd;
public:
    ExprAGaussNode(ExprNode* m, ExprNode* s, ExprNode* d) : m_mu(m), m_sigma(s), m_dlimit(d){}
    virtual void Evaluate() 
    {
        Gen gen(rd());
        Dis dis(params[0], params[1]);
        double result = 0;
        do
        {
            result = dis(gen);
        }while(abs(result-params[0])<=params[2]);
        m_value = result;
    }
};

使用模板的方式，应该是更方便一些的，可以直接扩展到其它的，带有多个参数的自定义函数上，对每个自定义函数，只需要定义函数实现的仿函数就可以了。

很可惜的是，使用vector<ExprNode*> m_params可以应对任意参数个数的函数，但只能用于自定义的函数。对于cmath里面的其它简单函数，比如sin，就不能这样用了。
并且，不能像plus函数一样，作为构造函数的参数传入，也不能像agauss函数一样，作为模板参数传入。而cmath中还有很多像sin这样的函数。
我们来比较一下plus和sin函数的实现，如下，

// header: <functional>
template< class T > struct plus
{
    T operator()(const T &lhs, const T &rhs) const 
    {
        return lhs + rhs;
    }
}
// header: <cmath>
double      sin( double arg );
template< class T > complex<T> sin( const complex<T>& z );
template< class T > valarray<T> sin( const valarray<T>& va );

在仿函数的头文件里面，实现了plus的仿函数结构。而在cmath头文件里，sin使用模板函数实现多种参数类型的支持。
所以plus可以作为以类型作为模板参数，也可以以仿函数作为参数。而sin则不可以，但是sin可以作为函数指针的参数。

要实现对sin这一类简单函数的支持，显然使用模板是最方便的方法，这就需要将sin函数转化为仿函数的结构。参考http://stackoverflow.com/questions/10213427/passing-a-functor-as-c-template-parameter ，我们就有了这样的转换方法，

template< double (*FuncPtr)(double) > struct FuncToType
{
    double operator()(double t)
    {
        return FuncPtr(t);
    }
};

然后我们定义支持一个参数的函数节点的模板，

template<typename FuncName>
class ExprFuncOneNode : public ExprNode
{
private:
    ExprNode* m_pexpr;
    FuncName m_func;
public:
    ExprFuncOneNode(ExprNode* e):m_pexor(e){}
    virtual void Evaluate() { m_value =  m_func(m_pexpr->Value());}
};

现在再来看四则运算符节点的实现，或许改成使用模板方式实现更好。所以对函数节点的实现，就可以按参数个数来分类，分别使用模板实现。

好，表达式的数据结构设计就到此为止。如果您有更好的建议，或者上面的代码或思路有问题，请多多指教。

posted @ 2013-03-28 11:30 Frandy.CH 阅读(911) 评论(2) 收藏举报

刷新页面返回顶部

Frandy.CH

符号化表达式设计(一)

公告