doxy/html/cg__stitch__cameras_8cc_source.html

 #include "../lib/common.h"
 #include "../lib/args.h"
 #include "../lib/json.h"
 #include "../lib/camera.h"
 #include "../lib/dataset.h"
 #include "../lib/intrinsics.h"
 #include "../lib/misc.h"
 #include "../lib/assert.h"
 #include "lib/cg/references_grid.h"
 #include "lib/cg/relative_camera_positions.h"
 #include <map>
 #include <iostream>
 #include <vector>
 #include <cmath>
 #include <utility>
 #include <set>
 #include <fstream>

 using namespace tlz;

 const bool verbose = false;


 int main(int argc, const char* argv[]) {
     get_args(argc, argv, "dataset_parameters.json refgrid.json rcpos.json intr.json R.json out_cameras.json [out_camera_centers.txt]");
     dataset datas = dataset_arg();
     references_grid rgrid = references_grid_arg();
     relative_camera_positions rcpos = relative_camera_positions_arg();
     intrinsics intr = intrinsics_arg();
     mat33 R = decode_mat(json_arg());
     std::string out_cameras_filename = out_filename_arg();
     std::string out_camera_centers_filename = out_filename_opt_arg();

     Assert(intr.distortion.is_none(), "input cors + intrinsics must be without distortion");

     auto reference_target_camera_positions = rcpos.to_reference_target_positions();
     auto all_target_vws = get_target_views(rcpos);

     std::cout << "computing relative positions of reference views" << std::endl;
     auto reference_camera_displacement = [&](view_index ref_a, view_index ref_b) {
         vec2 displacements_sum = 0.0;
         real displacements_weights_sum = 0.0;
         std::map<view_index, vec2> ref_a_target_camera_positions;

         if(reference_target_camera_positions.find(ref_a) != reference_target_camera_positions.end())
         for(const auto& p : reference_target_camera_positions.at(ref_a)) {
             const view_index& target = p.first;
             const vec2& camera_position = p.second;
             ref_a_target_camera_positions[target] = camera_position;
         }

         if(reference_target_camera_positions.find(ref_b) != reference_target_camera_positions.end())
         for(const auto& p : reference_target_camera_positions.at(ref_b)) {
             const view_index& target = p.first;
             auto ref_a_pos_it = ref_a_target_camera_positions.find(target);
             if(ref_a_pos_it != ref_a_target_camera_positions.end()) {
                 vec2 ref_a_pos = ref_a_pos_it->second;
                 vec2 ref_b_pos = p.second;

                 displacements_sum += (ref_a_pos - ref_b_pos);
                 displacements_weights_sum += 1.0;
             }
         }

         if(displacements_weights_sum == 0.0)
             throw std::runtime_error("could not compute displacement from ref " + encode_view_index(ref_a) + " to ref " + encode_view_index(ref_b));

         return displacements_sum / displacements_weights_sum;
     };


     std::map<view_index, vec2> absolute_reference_camera_positions;
     auto add_reference_camera_position = [&](const view_index& ref_a, const view_index& ref_b) {
         std::cout << "    stitching position of reference view " << ref_b << " onto " << ref_a << std::endl;
         vec2 displacement = reference_camera_displacement(ref_a, ref_b);
         std::cout << "    ref" << ref_b << " = " << displacement << " + ref" << ref_a << std::endl;
         absolute_reference_camera_positions[ref_b] = absolute_reference_camera_positions.at(ref_a) + displacement;
     };

     int mid_col = rgrid.cols() / 2, mid_row = rgrid.rows()/2;
     absolute_reference_camera_positions[rgrid.view(mid_col, mid_row)] = vec2(0.0, 0.0);
     for(int col = mid_col-1; col >= 0; col--) {
         add_reference_camera_position(rgrid.view(col+1, mid_row), rgrid.view(col, mid_row));
         for(int row = mid_row-1; row >= 0; row--) add_reference_camera_position(rgrid.view(col, row+1), rgrid.view(col, row));
         for(int row = mid_row+1; row < rgrid.rows(); row++) add_reference_camera_position(rgrid.view(col, row-1), rgrid.view(col, row));
     }
     for(int col = mid_col+1; col < rgrid.cols(); col++) {
         add_reference_camera_position(rgrid.view(col-1, mid_row), rgrid.view(col, mid_row));
         for(int row = mid_row-1; row >= 0; row--) add_reference_camera_position(rgrid.view(col, row+1), rgrid.view(col, row));
         for(int row = mid_row+1; row < rgrid.rows(); row++) add_reference_camera_position(rgrid.view(col, row-1), rgrid.view(col, row));
     }


     std::ofstream out_camera_centers_stream;
     if(! out_camera_centers_filename.empty()) {
         out_camera_centers_stream.open(out_camera_centers_filename);
         out_camera_centers_stream << "x y idx_x idx_y chosen\n";
         out_camera_centers_stream << std::setprecision(10);
     }

     std::map<view_index, vec2> absolute_target_camera_positions;
     if(absolute_reference_camera_positions.size() == 1) {
         for(const auto& p : reference_target_camera_positions.begin()->second) {
             const view_index& target_idx = p.first;
             const vec2& pos = p.second;
             absolute_target_camera_positions[p.first] = pos;
             if(out_camera_centers_stream.is_open())
                 out_camera_centers_stream << pos[0] << ' ' << pos[1] << ' ' << target_idx.x << ' ' << target_idx.y << " 1\n";
         }

     } else {
         reference_target_camera_positions.clear();
         auto target_reference_camera_positions = rcpos.to_target_reference_positions();

         std::vector<real> overlap_radii;

         std::cout << "stitching camera positions from different reference views" << std::endl;
         for(const view_index& target_idx : all_target_vws) {
             auto target_positions_it = target_reference_camera_positions.find(target_idx);
             if(target_positions_it == target_reference_camera_positions.end()) continue;

             struct sample {
                 vec2 position;
                 view_index target_idx;
                 view_index ref_idx;

                 sample(const vec2& pos, const view_index& tg, const view_index& rf) :
                     position(pos), target_idx(tg), ref_idx(rf) { }

                 int idx_dist() const {
                     return sq(ref_idx.x - target_idx.x) + sq(ref_idx.y - target_idx.y);
                 }
             };
             std::ptrdiff_t chosen_sample_i = -1;
             std::vector<sample> samples;

             for(const auto& p : target_positions_it->second) {
                 const view_index& ref_idx = p.first;

                 const vec2& pos = p.second;
                 if(absolute_reference_camera_positions.find(ref_idx) == absolute_reference_camera_positions.end()) continue;
                 const vec2& absolute_reference_pos = absolute_reference_camera_positions.at(ref_idx);

                 vec2 abs_pos = absolute_reference_pos + pos;

                 samples.emplace_back(abs_pos, target_idx, ref_idx);

                 if(chosen_sample_i == -1) chosen_sample_i = samples.size()-1;
                 else if(samples.back().idx_dist() < samples.at(chosen_sample_i).idx_dist()) chosen_sample_i = samples.size()-1;
             }

             for(const sample& samp : samples) {
                 bool chosen = (&samp == &samples.at(chosen_sample_i));
                 if(chosen)
                     absolute_target_camera_positions[samp.target_idx] = samp.position;

                 if(out_camera_centers_stream.is_open())
                     out_camera_centers_stream << samp.position[0] << ' ' << samp.position[1] << ' ' << samp.target_idx.x << ' ' << samp.target_idx.y << ' ' << (chosen ? '1' : '0') << '\n';
             }

             if(samples.size() > 1) {
                 vec2 mean(0.0, 0.0);
                 for(const sample& samp : samples) mean += samp.position;
                 mean /= real(samples.size());
                 real max_dist = 0;
                 for(const sample& samp : samples) max_dist = std::max(max_dist, cv::norm(samp.position, mean));
                 overlap_radii.push_back(max_dist);
             }
         }

         real overlap_radii_avg = 0.0;
         for(real overlap_radius : overlap_radii) overlap_radii_avg += overlap_radius;
         overlap_radii_avg /= overlap_radii.size();
         std::sort(overlap_radii.begin(), overlap_radii.end());
         std::cout << "    overlapping positions (more = better): " << overlap_radii.size() << std::endl;
         std::cout << "    average radius (smaller = better): " << overlap_radii_avg << std::endl;
         std::cout << "    median radius: " << overlap_radii[overlap_radii.size()/2] << std::endl;
         std::cout << "    maximum radius: " << overlap_radii.back() << std::endl;
     }


     std::cout << "computing camera array" << std::endl;
     camera_array cameras;
     auto really_all_target_views = datas.indices();
     for(const view_index& target_idx : really_all_target_views) {
         auto it = absolute_target_camera_positions.find(target_idx);
         if(it == absolute_target_camera_positions.end()) {
             std::cout << "no camera position for " << target_idx << std::endl;
         }
         const vec2& camera_position = it->second;

         camera cam;
         cam.name = datas.view(target_idx).camera_name();
         cam.intrinsic = intr.K;
         cam.rotation = R;
         cam.translation = R * vec3(camera_position[0], camera_position[1], 0.0);
         cameras.push_back(cam);
     }


     std::cout << "saving cameras" << std::endl;
     export_cameras_file(cameras, out_cameras_filename);

     std::cout << "done" << std::endl;
 }

tlz::relative_camera_positions
Definition: relative_camera_positions.h:12

tlz::export_cameras_file
void export_cameras_file(const camera_array &cameras, const std::string &filename)
Definition: camera.cc:79

tlz::camera
Definition: camera.h:13

tlz::sq
Numeric sq(Numeric n)
Compute square of a number.
Definition: misc.h:17

tlz::relative_camera_positions::to_target_reference_positions
target_reference_positions_type to_target_reference_positions() const
Definition: relative_camera_positions.cc:35

tlz::index_2d::x
int x
Definition: common.h:89

tlz::get_target_views
std::vector< view_index > get_target_views(const relative_camera_positions &rcpos)
Definition: relative_camera_positions.cc:55

tlz::dataset
Definition: dataset.h:73

tlz::camera::intrinsic
mat33 intrinsic
Definition: camera.h:15

tlz::encode_view_index
std::string encode_view_index(view_index idx)
Definition: dataset.cc:275

tlz::camera::name
std::string name
Definition: camera.h:14

references_grid.h

tlz::index_2d::y
int y
Definition: common.h:90

tlz::camera::rotation
mat33 rotation
Definition: camera.h:16

tlz::vec2
cv::Vec< real, 2 > vec2
Definition: common.h:22

tlz::intrinsics
Definition: intrinsics.h:27

tlz::references_grid
Definition: references_grid.h:11

tlz::dataset::view
dataset_view view(int x) const
Definition: dataset.cc:243

relative_camera_positions.h

tlz::decode_mat
cv::Mat_< real > decode_mat(const json &j)
Definition: json.cc:32

tlz::out_filename_opt_arg
std::string out_filename_opt_arg(const std::string &def)
Definition: args.cc:110

tlz::intrinsics_arg
intrinsics intrinsics_arg()
Definition: intrinsics.cc:119

tlz::references_grid_arg
references_grid references_grid_arg()
Definition: references_grid.cc:60

tlz::json_arg
json json_arg()
Definition: json.h:34

tlz::relative_camera_positions_arg
relative_camera_positions relative_camera_positions_arg()
Definition: relative_camera_positions.cc:83

tlz::view_index
Definition: common.h:116

tlz::intrinsics::distortion
distortion_parameters distortion
Definition: intrinsics.h:30

tlz::dataset_arg
dataset dataset_arg()
Definition: dataset.cc:297

tlz::mat33
cv::Matx< real, 3, 3 > mat33
Definition: common.h:26

tlz::real
double real
Definition: common.h:16

tlz::distortion_parameters::is_none
bool is_none() const
Definition: intrinsics.h:21

tlz::vec3
cv::Vec< real, 3 > vec3
Definition: common.h:23

tlz::references_grid::view
view_index view(std::ptrdiff_t col, std::ptrdiff_t row) const
Definition: references_grid.cc:6

tlz::dataset_view::camera_name
std::string camera_name() const
Definition: dataset.cc:60

Assert
#define Assert
Definition: assert.h:40

verbose
const bool verbose
Definition: cg_stitch_cameras.cc:21

tlz::out_filename_arg
std::string out_filename_arg()
Definition: args.cc:104

tlz::references_grid::cols
std::size_t cols() const
Definition: references_grid.h:15

tlz::camera_array
std::vector< camera > camera_array
Definition: camera.h:26

tlz::relative_camera_positions::to_reference_target_positions
reference_target_positions_type to_reference_target_positions() const
Definition: relative_camera_positions.cc:23

main
int main(int argc, const char *argv[])
Definition: cg_stitch_cameras.cc:24

tlz
Definition: feature_slopes.cc:7

tlz::intrinsics::K
mat33 K
Definition: intrinsics.h:28

tlz::dataset::indices
std::vector< view_index > indices() const
Definition: dataset.cc:235

tlz::camera::translation
vec3 translation
Definition: camera.h:17

tlz::references_grid::rows
std::size_t rows() const
Definition: references_grid.h:16

tlz::get_args
void get_args(int argc, const char *argv[], const std::string &usage)
Definition: args.cc:49