◆ gemm_transpose()

template<Rank summed, Rank frank, Rank srank, Rank rrank, typename Scalar >

void syten::CudaDenseTensorImpl::gemm_transpose	(	CudaDenseTensor< frank, Scalar > const &	a,
		CudaDenseTensor< srank, Scalar > const &	b,
		CudaDenseTensor< rrank, Scalar > &	r,
		std::array< int, frank > const &	c_a,
		std::array< int, srank > const &	c_b
	)

inline

Last part of a transpose-transpose-gemm-transpose CUDA tensor contraction.

Contracts the two supplied tensors and transposes the result if necessary.

Here is the call graph for this function: