tmp

2024-12-24 09:57:24 +08:00 · 2024-12-24 09:57:24 +08:00 · 4a3ee5c815
commit 4a3ee5c815
parent 2f55fac21e
3 changed files with 297 additions and 13 deletions
--- a/example/ex2.cpp
+++ b/example/ex2.cpp
@ -27,8 +27,8 @@
 #include "../lib/optimization.h"
-#define M 100
+#define M 90
-#define N 90
+#define N 100
 // get random floating points
 double random_double(double l, double t)
@ -134,28 +134,30 @@ int main(int argc, char const *argv[])
    // 生成一组正演解 包含一些大值和一些小值
 	gctl::array<double> fm(N);
 	int N2 = (int) N/2;
 	srand(time(0));
 	for (int i = 0; i < N2; i++)
 	{
-		//fm[i] = random_double(5, 10);
+		fm[i] = random_double(5, 10);
-		fm[i] = 10.0;
+		//fm[i] = 10.0;
 	}
 	for (int i = N2; i < N; i++)
 	{
-		//fm[i] = random_double(1, 2);
+		fm[i] = random_double(1, 2);
-		fm[i] = 1.0;
+		//fm[i] = 1.0;
 	}
 	for (int i = 0; i < N2; i++)
 	{
-		low[i] = 9.0; // 对解的范围进行约束
+		low[i] = 4.0; // 对解的范围进行约束
 		hig[i] = 11.0;
 	}
 	for (int i = N2; i < N; i++)
 	{
 		low[i] = 0.0;
-		hig[i] = 2.0;
+		hig[i] = 3.0;
 	}
    ex2 e;
@ -164,6 +166,8 @@ int main(int argc, char const *argv[])
 	gctl::lgd_para my_para = e.default_lgd_para();
 	my_para.flight_times = 20000;
 	my_para.batch = 100;
 	my_para.fmt = 0.5;
 	my_para.smt = 0.05;
    e.set_lgd_para(my_para);
    e.LGD_Minimize(m, mean_m, stddev_m, low, hig);
--- a/lib/optimization/lgd.cpp
+++ b/lib/optimization/lgd.cpp
@ -30,7 +30,7 @@
 /**
 * Default parameter for the Lévy-Gradient Descent (L-GD) method.
 */
-static const gctl::lgd_para lgd_defparam = {1000, 0, 0, 1e-5, 1.0, 1.5, 0.01, 1e-8, -1.0};
+static const gctl::lgd_para lgd_defparam = {1000, 0, 0, 1e-5, 1.0, 1.5, 0.01, 1e-8, -1.0, 0.5, 0.05};
 gctl::lgd_solver::lgd_solver()
 {
@ -370,6 +370,62 @@ void gctl::lgd_solver::LGD_Minimize(array<double> &best_m, array<double> &mean_m
    return;
 }
 void gctl::lgd_solver::LGD_Minimize_Momentum(array<double> &best_m, array<double> &mean_m, array<double> &std_m, 
    std::ostream &ss, bool verbose, bool err_throw)
 {
    if (lgd_silent_)
    {
        lgd_return_code ret = lgd_momentum(best_m, mean_m, std_m);
        if (ret < 0) lgd_error_str(ret, ss, true);
        return;
    }
    // 使用lcg求解 注意当我们使用函数指针来调用求解函数时默认参数不可以省略
 #ifdef GCTL_OPENMP
    double start = omp_get_wtime();
    lgd_return_code ret = lgd_momentum(best_m, mean_m, std_m);
    double end = omp_get_wtime();
    double costime = 1000*(end-start);
 #else
    clock_t start = clock();
    lgd_return_code ret = lgd_momentum(best_m, mean_m, std_m);
    clock_t end = clock();
    double costime = 1000*(end-start)/(double)CLOCKS_PER_SEC;
 #endif
    if (!err_throw) std::clog << std::endl << "Solver: LGDM. Time cost: " << costime << " ms" << std::endl;
    if (verbose) lgd_error_str(ret, ss, err_throw);
    else if (ret < 0) lgd_error_str(ret, ss, err_throw);
    return;
 }
 void gctl::lgd_solver::LGD_Minimize_Momentum(array<double> &best_m, array<double> &mean_m, array<double> &std_m, 
    const array<double> &lows, const array<double> &higs, std::ostream &ss, bool verbose, bool err_throw)
 {
    lgd_ques_num_ = best_m.size();
    if (lgd_ques_num_ != lows.size() || lgd_ques_num_ != higs.size())
    {
        throw std::runtime_error("[gctl::lgd_solver] arraies' size do not match.");
    }
    lgd_low_.resize(lgd_ques_num_);
    lgd_hig_.resize(lgd_ques_num_);
    for (int i = 0; i < lgd_ques_num_; i++)
    {
        if (lows[i] >= higs[i])
        {
            throw std::runtime_error("[gctl::lgd_solver] Invalid bound value.");
        }
        lgd_low_[i] = lows[i];
        lgd_hig_[i] = higs[i];
    }
    lgd_has_range_ = true;
    LGD_Minimize_Momentum(best_m, mean_m, std_m, ss, verbose, err_throw);
    return;
 }
 gctl::lgd_return_code gctl::lgd_solver::lgd(array<double> &best_m, array<double> &mean_m, array<double> &std_m)
 {
    lgd_ques_num_ = best_m.size();
@ -534,3 +590,177 @@ gctl::lgd_return_code gctl::lgd_solver::lgd(array<double> &best_m, array<double>
    veccpy(best_m, b_m);
    return LGD_REACHED_MAX_ITERATIONS;
 }
 gctl::lgd_return_code gctl::lgd_solver::lgd_momentum(array<double> &best_m, array<double> &mean_m, array<double> &std_m)
 {
    lgd_ques_num_ = best_m.size();
    // check parameters
    if (lgd_ques_num_ <= 0) return LGD_INVALID_SOLUTION_SIZE;
    if (lgd_param_.flight_times <= 0) return LGD_INVALID_MAX_ITERATIONS;
    if (lgd_param_.epsilon <= 0) return LGD_INVALID_EPSILON;
    if (lgd_param_.stddev_v <= 0) return LGD_INVALID_STDV;
    if (lgd_param_.beta <= 1.0 || lgd_param_.beta >= 2.0) return LGD_INVALID_BETA;
    if (lgd_param_.alpha <= 0) return LGD_INVALID_ALPHA;
    if (lgd_param_.sigma <= 0) return LGD_INVALID_SIGMA;
    // initiate solutions
    mean_m.resize(lgd_ques_num_, 0.0); std_m.resize(lgd_ques_num_, 0.0);
    double gamma1 = tgamma(lgd_param_.beta + 1.0);
    double gamma2 = tgamma(0.5*(lgd_param_.beta + 1.0));
    double stddev_u = pow((gamma1*sin(0.5*GCTL_Pi*lgd_param_.beta)) / (gamma2*lgd_param_.beta*pow(2, 0.5*(lgd_param_.beta-1.0))), 1.0/lgd_param_.beta);
    unsigned int sd;
    if (lgd_param_.seed == 0) sd = std::chrono::system_clock::now().time_since_epoch().count();
    else sd = lgd_param_.seed;
    std::default_random_engine generator(sd);
    std::normal_distribution<double> dist_u(0, stddev_u);
    std::normal_distribution<double> dist_v(0, lgd_param_.stddev_v);
    std::uniform_real_distribution<double> dist_s(1.0, 2.0);
    array<double> g, g_mem, g_orth, new_mean, b_m, alphas, fst_mt, sec_mt;
    g.resize(lgd_ques_num_); g_mem.resize(2*lgd_ques_num_); g_orth.resize(2*lgd_ques_num_);
    new_mean.resize(lgd_ques_num_); b_m.resize(lgd_ques_num_); alphas.resize(lgd_ques_num_);
    double mt = 1.0, vt = 1.0;
    fst_mt.resize(lgd_ques_num_, 0.0);
    sec_mt.resize(lgd_ques_num_, 0.0);
    // 初始化参数变化范围为lgd_param_.alpha
    vecset(alphas, lgd_param_.alpha);
    if (lgd_has_range_)
    {
        vecdiff(alphas, lgd_hig_, lgd_low_);
        vecscale(alphas, lgd_param_.alpha);
    }
    if (lgd_has_alpha_)
    {
        veccpy(alphas, lgd_alpha_, lgd_param_.alpha);
    }
    double fx_best, fx_tmp, direct_mod, levy_length;
    double fx_mean = NAN;
    // 开始飞行
    int rcd_times = 0;
    lgd_trace_times_ = 0;
    for (int ft = 0; ft <= lgd_param_.flight_times; ft++)
    {
        // 计算尝试解
        fx_tmp = LGD_Evaluate(best_m, g);
        if (ft == 0 || fx_tmp < fx_best)
        {
            fx_best = fx_tmp;
            veccpy(b_m, best_m);
        }
        // 记录飞行轨迹
        if (lgd_param_.lambda <= 0.0 || (lgd_param_.lambda > 0.0 && fx_tmp <= lgd_param_.lambda))
        {
            for (int i = 0; i < lgd_ques_num_; i++)
            {
                std_m[i] = dynamic_stddev(std_m[i], rcd_times, mean_m[i], best_m[i], new_mean[i]);
                mean_m[i] = new_mean[i];
            }
            rcd_times++;
            if (lgd_save_trace_)
            {
                lgd_trace_.append_array(best_m);
                lgd_trace_times_++;
            }
        }
        if (LGD_Progress(ft, fx_tmp, fx_mean, fx_best, lgd_param_))
        {
            // 将迭代结果返还给m
            veccpy(best_m, b_m);
            return LGD_STOP;
        }
        if (lgd_param_.batch > 0 && (rcd_times+1)%lgd_param_.batch == 0)
        {
            fx_mean = LGD_Evaluate(mean_m, g);
            if (fx_mean < lgd_param_.epsilon)
            {
                LGD_Progress(ft, fx_tmp, fx_mean, fx_best, lgd_param_);
                // 将迭代结果返还给m
                veccpy(best_m, b_m);
                return LGD_CONVERGENCE;
            }
        }
        // 驻点检测
        direct_mod = sqrt(vecdot(g, g));
        if (direct_mod < lgd_param_.sigma)
        {
            if (ft == 0) // 初次飞行时无记录
            {
                do // 如果梯度消失 则采用一个随机方向
                {
                    for (int i = 0; i < lgd_ques_num_; i++)
                    {
                        g[i] = dist_s(generator);
                    }
                    direct_mod = sqrt(vecdot(g, g));
                }
                while (direct_mod < lgd_param_.sigma);
            }
            else // 如果梯度消失 则朝着上一次迭代方向的正交方向走一步
            {
                for (int i = 0; i < lgd_ques_num_; i++)
                {
                    g_mem[i+lgd_ques_num_] = dist_s(generator);
                }
                schmidt_orthogonal(g_mem, g_orth, 2);
                for (int i = 0; i < lgd_ques_num_; i++)
                {
                    g[i] = g_orth[i+lgd_ques_num_];
                }
                direct_mod = 1.0; // 此时的模量为单位模量
            }
        }
        // 莱维飞行的步长 注意原公式中无最外层绝对值符号
        // 这是我们需要步长的绝对值 因此取绝对值
        levy_length = fabs(dist_u(generator)/pow(fabs(dist_v(generator)), 1.0/lgd_param_.beta));
        mt *= lgd_param_.fmt;
        vt *= lgd_param_.smt;
        for (int i = 0; i < lgd_ques_num_; i++)
        {
            g[i] = levy_length*alphas[i]*g[i]/direct_mod;
            fst_mt[i] = (lgd_param_.fmt*fst_mt[i] + (1.0 - lgd_param_.fmt)*g[i])/(1.0 - mt);
            sec_mt[i] = (lgd_param_.smt*sec_mt[i] + (1.0 - lgd_param_.smt)*g[i]*g[i])/(1.0 - vt);
            best_m[i] -= fst_mt[i]/(sqrt(sec_mt[i]) + 1e-10);            
        }
        if (!vecvalid(best_m))
        {
            return LGD_NAN_VALUE;
        }
        // 记录梯度方向
        for (int i = 0; i < lgd_ques_num_; i++)
        {
            g_mem[i] = g[i];
        }
        // 这里可以添加取值范围的约束
        if (lgd_has_range_)
        {
            vecbtm(best_m, lgd_low_);
            vectop(best_m, lgd_hig_);
        }
    }
    // 将迭代结果返还给m
    veccpy(best_m, b_m);
    return LGD_REACHED_MAX_ITERATIONS;
 }
--- a/lib/optimization/lgd.h
+++ b/lib/optimization/lgd.h
@ -138,8 +138,24 @@ namespace gctl
         * is set. The default is -1.0.
         */
        double lambda;
        /**
         * @brief First order moment.
         * 
         */
        double fmt;
        /**
         * @brief Second order moment.
         * 
         */
        double smt;
    };
    /**
     * @brief The lévy gradient descent solver (LGD).
     * 
     */
    class lgd_solver
    {
    public:
@ -169,13 +185,39 @@ namespace gctl
        virtual int LGD_Progress(const int curr_t, const double curr_fx, const double mean_fx, 
            const double best_fx, const lgd_para &param);
        /**
         * @brief Susppend all output info.
         * 
         */
        void lgd_silent();
        /**
         * @brief Set interval to run the LGD_Progress function.
         * 
         * @param inter 
         */
        void set_lgd_report_interval(int inter);
        /**
         * @brief Show solver setup.
         * 
         */
        void show_solver();
-        void set_lgd_record_trace(); ///< Turn on the recording of fight traces.
+        /**
-        // Save fight traces to file. Not that only qualified solutions will be 
+         * @brief Turn on the recording of fight traces. Use this with caution as it may use a lot of momeries.
-        // saved if the recording threshold is set. 
+         * 
         */
        void set_lgd_record_trace();
        /**
         * @brief Save fight traces to file.
         * 
         * @note Must turn on the trace recording for this function to work properly. 
         * Only qualified solutions will be saved if the recording threshold is set.
         * 
         * @param trace_file output file.
         */
        void save_lgd_trace(std::string trace_file);
        /**
@ -227,9 +269,17 @@ namespace gctl
            double low, double hig, std::ostream &ss = std::clog, bool verbose = true, 
            bool err_throw = false);
        void LGD_Minimize_Momentum(array<double> &best_m, array<double> &mean_m, array<double> &std_m, 
            std::ostream &ss = std::clog, bool verbose = true, bool err_throw = false);
        void LGD_Minimize_Momentum(array<double> &best_m, array<double> &mean_m, array<double> &std_m, 
            const array<double> &lows, const array<double> &higs, std::ostream &ss = std::clog, 
            bool verbose = true, bool err_throw = false);
    private:
        void lgd_error_str(lgd_return_code err_code, std::ostream &ss = std::clog, bool err_throw = false);
        lgd_return_code lgd(array<double> &best_m, array<double> &mean_m, array<double> &std_m);
        lgd_return_code lgd_momentum(array<double> &best_m, array<double> &mean_m, array<double> &std_m);
    private:
        lgd_para lgd_param_;